統計学に出てくる「誤差」のまとめ(系統誤差と偶然誤差の違いなどをわかりやすく解説)

統計学を学ぶ上で重要な概念に「誤差」があります。しかし、誤差には様々な種類があり混乱しがちです。この記事では、統計学を学び始めた方向けに誤差に関する基礎知識をまとめています。

各種誤差の関係性

今回解説をする誤差に関する関係を図でまとめました。この全体像をもとに各要素を1つずつ解説していきます。

系統誤差と偶然誤差

まずは、誤差には「偶然誤差」と「系統誤差」の2つがあることを抑えておきましょう。

「系統誤差」は、何かしらの原因によって発生してしまう誤差のことです。例えば、あるセレブ御用達の高級化粧品の40代女性における知名度を知るために街頭で200名にアンケートを取るとします。そのとき、アンケートを取る場所を高級住宅街に限定して実施すると実態よりも高い知名度が出て結果に偏りが生じてしまう可能性があります。系統誤差はこのような場合に発生する誤差のことを言います。

一方で「偶然誤差」は、その名の通り、偶然に発生する誤差のことです。仮に40代女性に系統誤差が発生しない方法でアンケートを実施した場合でも真の商品知名度(母集団である国内の40代女性全体の知名度)と街頭で200名に聞いた知名度(標本の知名度)には必ず差が生じます。系統誤差の場合は、誤差の方向が過多/過少に傾向が決まりますが、(例えば、高級住宅街でアンケートを取ると実態よりも知名度は大きくなる)、偶然誤差の場合は、誤差の方向が大きいか、小さいかは決まっていないと言う違いもあります。このような特性から「ランダム誤差」とも言われることがあります。

標準誤差とは

次に偶然誤差の一例である「標準誤差」について解説をします。標準誤差は、母集団の値に対して、標本データからの推定値と比較しての差を意味しており、つまりは「推定の精度」を意味しています。

また、標準誤差は、標本分布をもとに確率論で評価(どれくらいの誤差かを算出)することができ、別の定義としては、標準誤差は標本分布の「標準偏差(ばらつき)」と表すこともできます。

「標準誤差」と「標準偏差」は似通った言葉で、混同しがちなので注意をしましょう。母数(母平均)に対するズレを意味するので「誤差」と表現していると解釈すると覚えやすいかと思います。

標準偏差について改めて確認をしたい方はこちらの記事を参考にしてください。

https://korekara-marketing.com/statistics-standard-deviation/

次に標準誤差に関連して「標本誤差」と言う概念について解説をします。

標本誤差とは(標本誤差と標準誤差の違い)

「標本誤差」は、まず前提として標本調査でのみ発生し、全数調査では発生しません。標本誤差は、標本の値と母集団の値との間に発生する差を意味します。「標準誤差」との違いは図で整理すると次のようになりますが、関係性としては、「標本誤差(母集団と標本の値の差)」の大きさを「標準誤差(標本分布のばらつき)」で確率論をもとに評価するということになります。

標本誤差についてはこの記事でも詳しく扱っていますので良ければ読んでみてください。

https://korekara-marketing.com/statistics-sampling-error/

また、標本誤差に対して、「非標本誤差」が存在します。非標本誤差は、全数調査でも起こりうる誤差で、標本誤差以外の要因の誤差をいいます。例えば、回答者の誤回答や未回答、データ収集時のミスなどです。

全数調査標本調査定義
標本誤差✖️標本を使うことにより起こる母集団との誤差。統計的に評価ができる
非標本誤差標本誤差以外の誤差
(例)回答者の誤回答や未回答、データの収集や集計時のミス

標本誤差と非標本誤差については、動画でも解説をしているので良ければご視聴ください。

以上が各種誤差の関係性や違いとなります。非常に似た言葉で初めのうちは混同してしまいますが、何度も繰り返し定義を確認するとだんだんと定着してきます。ぜひ各誤差の違いを理解し、文献などを読む際に役立ててください。

最新情報をチェックしよう!