この記事では、身近なビジネスケース(認知度調査)をもとに推測統計学の「仮説検定」について解説しています。ぜひ統計学に興味はあるけれど、実際の業務にどう応用されているのかイメージを持ちたい、そもそも仮説検定について理解したい。という方におすすめの記事となっています。
仮説検定とは?
「仮説検定」とは何か?についてみていく前に、まず統計学の全体像から把握していきましょう。
統計学は、大きく「記述統計学」と「推測統計学」に分類できます。記述統計学は、皆さんにも馴染みのある平均値や中央値、また相関関係など手元にあるデータの特徴を捉える統計学になります。一方、推測統計学は、母集団の特徴を標本から捉える統計学となります。推測統計学に「推定」があり、今回の記事で解説する「仮説検定」があります。推定と仮説検定の違いを捉えながら仮説検定について理解していきましょう。
推定は、標本のデータから母集団の特徴である平均値や比率などの「値」を推測するものです。図で表すとこのような関係性にあり、例えば、区間推定では、母比率がどこからどこまでの値に含まれているだろうと推測します。
推定についてはこちらの記事で詳しく解説しているので、ぜひお読みください。
https://korekara-marketing.com/statistics-interval-estimation-2/
一方、仮説検定は、推定同様に標本データから母集団の特徴を推測するものですが、「母集団の特徴に仮説を立てて、その是非を判定する。」というのが仮説検定になります。推定は、母集団の特徴を具体値で推測するものですが、仮説検定は、母集団の特徴に仮説を立てて、それが正しそうかどうかを判定するというものです。この違いをまず理解しましょう。
仮説検定のビジネス的な意義
まず最初にそもそも「仮説検定」ができるようになることでどのようなビジネス上のメリットがあるのかを考えてみましょう。もし誤差レベルの差にもかかわらず案を採用してしまうと、ビジネス上、誤った判断をする恐れがあります。ですが、統計的に意味のある差かを判定できるようになることで、誤差レベルの差を採用することを避けられ、ビジネス上、より効果が期待できる選択をしやすくなると言えます。
あくまで確率論の話なので100%正しい判断というわけではないという点に注意するのと、そもそも検証しようとしている差に意味があるのかは考えておく必要があります。例えば、クリック率が2%の広告と1%の広告の差を仮説検定する際に、ビジネスにとってそもそもその1%の差がインパクトがある差なのかは考えることが大事です。
STEP1:仮説を立てる(帰無仮説と対立仮説の設定)
具体的に認知度調査を事例に、次のケースで仮説検定をしていきましょう。
(例)半年に一度、自社商品のターゲットである30代男性の認知率をアンケートで200人に調査している。前回の調査では30%という結果で、今回は33%という結果だった。今回の結果は、前回の結果と差があったといえるだろうか?
この事例を見たときに、「33%なんだから差があったと言えるんじゃないの?」と思われるかもしれませんが、今回ランダムに選ばれた200名の回答結果がたまたま33%と差がある結果だったという可能性もあります。この3%の差が誤差の範囲なのか、それとも誤差とは言えない範囲で本当に認知率が上がった結果だと言えそうなのか、を仮説検定をもとに確率論から判定をしていきます。
まず仮説検定では、その名の通り、仮説を立てます。仮説には2種類あり、否定したい仮説と主張したい仮説です。否定したい仮説は今回でいうと「前回の認知率30%と差がない」という仮説で、これを統計学の専門用語で「帰無仮説」と言います。そしてもう1つの主張したい仮説は「前回の認知率30%と差がある」という仮説で、この主張したい仮説を対立仮説と言います。この2つの仮説のどっちが正しいといえそうか?を統計的に判定していきます。
仮説検定には、お作法として帰無仮説が正しいという前提に立って考えるという作法があります。今回の帰無仮説つまり否定したい仮説である「今回の調査で観測された認知率の結果は33%だったけど、前回の調査結果(30%)と差はないんじゃないの?」という仮説が正しいという前提で考えていきます。
ここで疑問に思われた方もいらっしゃると思いますが、なぜわざわざ否定したい仮説(帰無仮説)が正しい前提に立って検証するという周りくどそうな方法をとるのか?それは、「背理法」という方法で、帰無仮説が正しくないことを証明する方が、合理的に対立仮説が正しいことを証明できるからです。
どういうことかというと、対立仮説は差があるということ。つまり「AとBは等しくない」ということの証明が必要ですが、AとBが異なるという仮説は無限に設定することができ、証明が困難です。一方で、帰無仮説は、差がないことつまり「AとBが等しいこと」の証明が必要ですが、これはAとBが等しくない場合が1つでも見つかれば、帰無仮説を否定することになります。すなわち対立仮説の方が正しいと判定することができます。
このような理由から、対立仮説を証明するよりも帰無仮説を否定することで対立仮説を結果的に証明する方が合理的なのです。このような背景から仮説検定では、帰無仮説が正しいという前提に立って、否定できるかを証明するという流れになっていることを抑えておきましょう
STEP2:判定基準を決める(有意水準・棄却域の決定)
次のステップでは、帰無仮説が正しいのかどうかの判定基準についてみていきます。おさらいですが、仮説検定も区間推定と同様に手元にある標本のデータから母集団の特徴を推測するという統計学の手法でした。そのため仮説検定も区間推定と同じような考え方で確率論を用いて母集団を推測することができ、標本比率がどのような確率分布に従うのかをもとに今回の33%という結果が前回の30%という結果に対して誤差の範囲なのか?それとも誤差とは言えない範囲の結果なのか?を判定することができます。
まずどのような確率分布で考えるのか。今回、標本サイズが200と十分大きいため、「中心極限定理」を用い、標本比率は、図のような左右対称で綺麗な山型を描く正規分布に従うと仮定することができます。また、標本比率の平均は母集団の比率である母比率に一致するという特徴もありました。
今回この母比率は、前回の調査結果である30%つまり0.3と設定して考えます。そして今回の調査結果である33%つまり0.33が確率的に母比率である0.3に対して誤差の範囲なのか、誤差とは言えない範囲、つまり差があったと言える結果なのかをこの正規分布の特徴を使って検証していきます。
そしてその「誤差の範囲」とする基準を95%と定めます。逆に「誤差の範囲とは言えない範囲」は、両側の合わせて5%の区間と定めます。つまり、今回の0.33という比率の結果が、95%の範囲なのであれば「誤差の範囲」なので差はなかったと判断し、逆にこの5%の区間に入る場合は、「誤差とは言えない」つまり差があったと判定するというわけです。
帰無仮説が正しいかを判定する基準として、誤差とは言えない範囲と設定したこの5%という領域について、統計学の用語では、これを「有意水準」という言い方をします。有意水準とは、「ある事象が起こる確率が偶然とは考えにくい(有意である)と判断する確率のこと」です。そして帰無仮説が正しくないと否定する領域として「棄却域」という言い方でも表されます。この棄却域は当然ですが、有意水準によって決まります。また、この有意水準の節目となる地点を「限界値」といいます。ここよりも標本比率などの値が大きければ、もしくは小さければ、帰無仮説を棄却するという値になります。
これらの表現も覚えておきましょう。また、中心極限定理などこのSTEPで触れた内容はこちらの記事で詳しく解説していますので、必要な方は読んでみてください。
STEP3:判定する(仮説の棄却・採択)
このSTEPでは、決めた基準(棄却域)に対して、0.33という標本比率が、誤差範囲である95%の区間内に入るかを判定していきます。そのためには、95%の節目となる地点である「限界値」の値を求める必要がありますが、これは区間推定と同じ方法で計算することできます。
この記事で解説した区間推定のときは、標本誤差早見表でよく使われる標準偏差2つ分という値を使用して計算しましたが、今回は、95%の区間を正確に示す標準偏差1.96こ分で計算してこれらの地点を求めていきます。計算をすると0.236と0.364が95%の区間の境界点となりました。今回の0.33という結果は、ここに位置するため95%の区間に入り、母比率0.3に対しては誤差の範囲という結論になります。そのため残念ながら今回の調査の結果は前回の調査結果とは差がなかったということになり、帰無仮説が正しいという判定になります。ちなみにもし今回の調査の結果が0.37だったとしたらどうでしょうか?
この時は「誤差の範囲とは言えない」5%の区間のうち右側のここに入るので、0.37だった場合は、帰無仮説を否定して、認知率に差があったと判定します。このような流れで仮説検定を行うのです。
仮説検定をした結果、帰無仮説が正しいという結論に至った場合、帰無仮説を否定せずに帰無仮説が正しいと判定することを「帰無仮説を採択する」と統計学では表現します。また、逆に帰無仮説が正しくないという判定結果になった場合、「帰無仮説を棄却する」といいます。また、帰無仮説を棄却するということはすなわち、「対立仮説を採択する」ということになります。統計学の世界においてはこのような表現をすることを抑えておきましょう。
検定統計量(z値、zスコア)
ここまで仮説検定の流れは、大きくこの3つのステップだと説明をしてきましたが、ここで判定を行うステップの前に、検定統計量を求めるというステップを新たに追加して解説をしたいと思います。検定統計量とは、平たくいうと仮説検定をするために算出する値のことで得られた標本データから変換をして求めます。
この検定統計量は、仮説検定の目的に応じて多数存在しますが、今回のサンプルサイズが大きい、つまり大標本における比率について検定を行う場合は、このz値という検定統計量を用います。
このzとは異なるデータ同士を比較しやすく標準化した値を意味します。では、このz値という検定統計量をもとに比率の仮説検定をしてみましょう。
※標準化についてはこちらの記事で解説しています。
https://korekara-marketing.com/statistics-standardization/
標本比率の正規分布では、平均が母比率p、そして分布のばらつき度合いを示す標準偏差は、下図の式で表すことができました。これを「標準化」して検定統計量z値に変換すると、平均が0、標準偏差が1という非常にシンプルな正規分布になります。このように標準化した正規分布を「標準正規分布」といいます。
また、信頼度95%の限界値を標準化すると下限値が−1.96、上限値が1.96と表すことができます。
では、標準化は具体的にどのように計算されているのか。比率の場合、z値はこのような式で求めることができます。意味としては、標本比率から平均である母比率pを引き、標準偏差で割ります。標準化は平均を引き、標準偏差で割ること標準化することができます。
この計算式をもとにサンプルサイズが200で、母比率0.3に対して標本比率が0.33のときの差の検定を検定統計量zに変換して検定をしてみましょう。
式に値を代入するとこのようになります。まず分子について標準化する値である0.33から平均である母比率0.3を引きます。そして、分母にも母比率である0.3を代入していき、これを計算すると小数点第3位以下を四捨五入すると0.93となります。これが0.33を標準化してz値とした値になります。ルートの計算は機能付きの電卓やウェブサイトでも計算ができるサイトがありますので検索してみてください。
このz値0.93を標準正規分布上で見ると、このようになり、有意水準5%の棄却域に入らず、帰無仮説を棄却せずに採択するという判定となります。このように仮説検定では、通常、検定統計量という値を用いて判定をすることを新たに覚えておきましょう。
補足:両側検定と片側検定
今回の認知率のケースでは、認知率の結果に差があったかどうか。というお題で仮説検定をしました。その場合、標本比率の結果に差があるかは大きい方でも小さい方でもよいわけです。つまり帰無仮説を否定する棄却域は両側にあり、このように両側で仮説検定をすることを両側検定と言います。一方、前回の調査に対して認知率の結果が大きかったかどうかを判定したい場合は、このように一方向に対しての差を検証することになり、棄却域を片側に設定する「片側検定」を行います。
注意点として、両側検定と片側検定では同じ有意水準5%で設定した場合でも棄却域の確率が異なります。両側の場合は、これら両方を合わせて5%となるので、片側だけでは2.5%となります。片側検定の場合は、この片側だけで5%となります。
まとめ:仮説検定の流れ
仮説検定の流れについて改めて確認しましょう。
まず「仮説を立てる」では、否定したい仮説である帰無仮説と主張したい仮説である対立仮説の2つの仮説を立てました。そして帰無仮説が正しいという前提で仮説検定を行いました。
次に「判定基準を決める」では、どのような確率分布に従うと仮定するのか。例えば、標本比率のケースでは、正規分布に従うと仮定しました。そして、有意と判定する基準である有意水準を通常は5%と設定し、2つの値に対して差を見るのか、それとも一方の値よりも大きいもしくは小さいのかを見るかで、両側検定か片側検定かを決めました。こうしてこれらの決定をもとに帰無仮説を棄却する棄却域を決めました。
そして、検定統計量の算出では、検定をするための値である検定統計量を今回のケースでは、標本比率を標準化した値であるz値に変換して検定統計量を求めました。
最後に「判定する」では、求めた検定統計量と棄却域の限界値とを比較して帰無仮説を棄却するか採択するかを判定しました。
以上が仮説検定の解説になります。ぜひこの知識を定量アンケート調査や広告のABテストの判定など実務に生かしてみてください。
動画講座のお知らせ
この記事の内容を動画講座でも解説をしています。ご興味のある方はぜひご受講ください。