区間推定のまとめ(統計検定2級レベル)

区間推定でどの分布を扱うのかは初級者にとって迷いやすいポイントかと思います。私も統計検定2級を受験するにあたり最後まで不安なところでした。この記事では、統計検定2級レベルで扱う区間推定と確率分布についてまとめています。どんなビジネスケースで使われるのかも例示していますので、検定の受験対策や実務での応用にご活用ください。

区間推定において扱う分布のまとめ

まず、全体像を次の図で整理しておきます。何を対象とした区間推定なのかをもとにどの分布を用いるのかを定められるようにしておきましょう。

この全体像をもとに、各母数の区間推定で扱う確率分布について見ていきます。

母平均の区間推定(母分散が既知):標準正規分布

母平均の推定は、母分散が既知の場合と未知の場合で扱う分布が別れます。まず既知の場合は、標準正規分布を用いますが、母分散がわかっているという場合は、実社会ではあまりなく、通常は次のt分布を扱うことが多いです。95%信頼区間を求める場合は、以下の式となります。

母平均の区間推定(母分散が未知):t分布

次に母分散が未知の場合です。未知の場合は、不偏分散S2でt分布を用います。例えば、t分布では、自由度(n-1)がパラメータとなり、次のような式となります。

 \displaystyle \overline{x}-t_{\alpha/2}(n-1) \times \sqrt{\frac{s^{2}}{n}} \leq \mu  \leq \overline{x}+t_{\alpha/2}(n-1) \times \sqrt{\frac{s^{2}}{n}}

ちなみに母分散が未知で、t分布を扱っても、自由度(サンプル数)が大きくなると標準正規分布に近づいていく。

母分散の区間推定:カイ二乗分布

次に求める対象が母分散の場合です。分散を区間推定するケースとしては、例えば、部品や製品の生産において、大きさのバラツキを推定し、不良品率などを把握したい場合などが挙げられます。母分散の区間推定では、カイ二乗分布が用いられ、自由度がパラメータとなり、下記のような式となります。

母比率の区間推定:標準正規分布

最後に母比率の区間推定です。母比率を推定するケースとしては、例えば、30代男性500人に取ったブランド認知率のアンケート調査(標本)の結果から、ターゲット全体(母集団=30代男性全体)の認知率を推定する場合などです。TVの視聴率調査でも区間推定が使われています。母比率は、成功確率p,の二項分布と対応します。また、中心極限定理により、正規分布に近似できることから、母平均同様に標準正規分布を用いて95%信頼区間を次の式で推定ができます。