CATEGORY

統計学

【図解】事象とは?排反事象や余事象などの違いもイメージで理解しよう!

この記事では、統計学や確率における事象について解説していきます。 事象とは?(根元事象と全事象) 事象事象とは、実験や観察などの試行によって起る結果のことをいいます。サイコロの例で見ていくと、事象は例えばサイコロを投げて2や4といった偶数の目が出るといったことが挙げられます。 根元事象根元事象とは、これ以上分けることができない事象のことです。例えば、サイコロを振って2の目が出ることで、先ほどの偶数 […]

重回帰分析とは?Webマーケティングでの具体例で解説!

この記事では、ビジネスでもよく使われる分析手法である重回帰分析について解説します。 重回帰分析とは 重回帰分析とは、1つの目的変数を複数の説明変数を用いて予測する分析手法です。目的変数など回帰式に関する基本情報はこちらの記事を参照ください。 重回帰式は次のように表されます。yは目的変数、β0は切片、β1~β4は説明変数の係数です。 マーケティングにおいては、例えば、各種のマーケティング施策の売上へ […]

統計学の公式まとめ

期待値 離散型確率変数のとき(各値に各値の確率を掛けた総和) 連続型確率変数のとき(変数xに関数を掛けたものを積分) その他公式 E[aX] = aE[X] (定数はそのまま外に出せる) E[X + a] = E[X] + a (定数はそのまま外に出せる) E[X + Y] = E[X] + E[Y] (単純に分解できる) E[X – Y] = E[X] – E[Y](単純 […]

単回帰分析とは?説明変数・目的変数など基礎知識を解説

この記事では、回帰分析の中でも説明変数が1つである基礎的な単回帰分析について解説します。 回帰直線の構造(説明変数、目的変数。回帰係数) 回帰分析とは、2つの変数の間に因果関係があると見出し、変数xから変数yを予測することをいいます。 回帰分析の中でも1つの説明変数で目的変数を示すものを単回帰分析といい、回帰直線と呼ばれるy=ax+bの一次関数の式を用います。グラフで表すとこのようになり、aが直線 […]

相関関係とは?因果関係との違いや擬似相関などもまとめて理解しよう。

この記事では、相関関係について解説をします。 相関とは(正の相関、負の相関、無相関) 相関とは、変数同士の関係性を表したもので、例えば2つの変数の関係性を散布図で表すと大きく3つの関係性に大別することができます。 一番左が、正の相関で、「一方の変数が増えたとき、もう一方の変数も増える」という関係性をいいます。図としてはこのように右肩上がりに散布図が表現されます。 次に負の相関は「一方の変数が増えた […]

変動係数とは?大きさの異なるデータを比較しよう!

この記事では、変動係数について解説をします。まず、具体的な課題をもとに変動係数の意義について理解していきましょう。 変動係数とは?具体例で解説 ここにA社とB社という会社があり、A社の平均月間売上は1億円、B社の平均月間売上は300万円だったとします。また、各社の月間売上について、データのバラつきを表す指標である標準偏差は、A社が1000万円、B社が200万円。つまりA社は月間売上が平均の1億円を […]

データの標準化とは?代表例「偏差値」の求め方も解説

この記事では、統計学で頻出する「標準化」について解説します。 標準化(基準化)とは? 標準化(または基準化)とは、異なるデータ同士を比較する方法で、標準化の代表的な例は、学生時代によく使った「偏差値」になります。偏差値は次で解説をしますが、例えば数学と英語のテストなど異なる科目同士でも偏差値で比較することで、どちらのテストの結果が良かったのかを比較することができます。このように異なるデータ同士を比 […]

【データ分析の基礎知識】データのバラツキを示す偏差、分散、標準偏差についてシンプルに解説!

この記事では、データのバラツキを表す指標として、偏差、分散、標準偏差について解説していきます。統計学において非常に重要な指標となりますので、しっかりと理解していきましょう。 偏差とは こちらのイメージを使って説明をしていきます。X1~X5の5つの値と真ん中に引かれている線は5つの値の平均と捉えてください。平均を表すときはこのようにXの頭に「ー(バー)」を記載する表現が用いられます。 この平均を基準 […]

四分位数とは?範囲の求め方や箱ひげ図との関係についても解説

この記事では、データの分布を把握するために用いられる四分位数やグラフとして可視化した箱ひげ図について学んでいきます。 四分位数とは? データを小さい順に並べて四等分に区切ったものを四分位数(しぶんいすう)といいます。データの度数は25%ずつに分けられ、左から図のような名称が付けられています。 ・最小値・25%時点:第1四分位(Q1)・50%時点:第2四分位(Q2)※ちょうど真ん中を意味する「中央値 […]

【統計学の基礎知識】度数分布やヒストグラムについて端的に解説

この記事では、統計学の基礎知識として、まず知っておきたい、度数分布やヒストグラム、更に関連する相対度数や累積度数について解説します。 度数分布(度数分布表)とは 度数分布とは、データの集まりの特徴を把握でき、階級と度数を整理したもののことです。 こちらの表は、あるクラスの得点と人数について度数分布をまとめた度数分布表になります。階級とは、データを区切る範囲のことで、ここでは、10点刻みの得点の範囲 […]