CATEGORY

統計学

統計学の公式まとめ

期待値 離散型確率変数のとき(各値に各値の確率を掛けた総和) 連続型確率変数のとき(変数xに関数を掛けたものを積分) その他公式 E[aX] = aE[X] (定数はそのまま外に出せる) E[X + a] = E[X] + a (定数はそのまま外に出せる) E[X + Y] = E[X] + E[Y] (単純に分解できる) E[X – Y] = E[X] – E[Y](単純 […]

単回帰分析とは?説明変数・目的変数など基礎知識を解説

この記事では、回帰分析の中でも説明変数が1つである基礎的な単回帰分析について解説します。 回帰直線の構造(説明変数、目的変数。回帰係数) 回帰分析とは、2つの変数の間に因果関係があると見出し、変数xから変数yを予測することをいいます。 回帰分析の中でも1つの説明変数で目的変数を示すものを単回帰分析といい、回帰直線と呼ばれるy=ax+bの一次関数の式を用います。グラフで表すとこのようになり、aが直線 […]

相関関係とは?因果関係との違いや擬似相関などもまとめて理解しよう。

この記事では、相関関係について解説をします。 相関とは(正の相関、負の相関、無相関) 相関とは、変数同士の関係性を表したもので、例えば2つの変数の関係性を散布図で表すと大きく3つの関係性に大別することができます。 一番左が、正の相関で、「一方の変数が増えたとき、もう一方の変数も増える」という関係性をいいます。図としてはこのように右肩上がりに散布図が表現されます。 次に負の相関は「一方の変数が増えた […]

変動係数とは?大きさの異なるデータを比較しよう!

この記事では、変動係数について解説をします。まず、具体的な課題をもとに変動係数の意義について理解していきましょう。 変動係数とは?具体例で解説 ここにA社とB社という会社があり、A社の平均月間売上は1億円、B社の平均月間売上は300万円だったとします。また、各社の月間売上について、データのバラつきを表す指標である標準偏差は、A社が1000万円、B社が200万円。つまりA社は月間売上が平均の1億円を […]

データの標準化とは?代表例「偏差値」の求め方も解説

この記事では、統計学で頻出する「標準化」について解説します。 標準化(基準化)とは? 標準化(または基準化)とは、異なるデータ同士を比較する方法で、標準化の代表的な例は、学生時代によく使った「偏差値」になります。偏差値は次で解説をしますが、例えば数学と英語のテストなど異なる科目同士でも偏差値で比較することで、どちらのテストの結果が良かったのかを比較することができます。このように異なるデータ同士を比 […]

【データ分析の基礎知識】データのバラツキを示す偏差、分散、標準偏差についてシンプルに解説!

この記事では、データのバラツキを表す指標として、偏差、分散、標準偏差について解説していきます。統計学において非常に重要な指標となりますので、しっかりと理解していきましょう。 偏差とは こちらのイメージを使って説明をしていきます。X1~X5の5つの値と真ん中に引かれている線は5つの値の平均と捉えてください。平均を表すときはこのようにXの頭に「ー(バー)」を記載する表現が用いられます。 この平均を基準 […]

四分位数とは?範囲の求め方や箱ひげ図との関係についても解説

この記事では、データの分布を把握するために用いられる四分位数やグラフとして可視化した箱ひげ図について学んでいきます。 四分位数とは? データを小さい順に並べて四等分に区切ったものを四分位数(しぶんいすう)といいます。データの度数は25%ずつに分けられ、左から図のような名称が付けられています。 ・最小値・25%時点:第1四分位(Q1)・50%時点:第2四分位(Q2)※ちょうど真ん中を意味する「中央値 […]

【統計学の基礎知識】度数分布やヒストグラムについて端的に解説

この記事では、統計学の基礎知識として、まず知っておきたい、度数分布やヒストグラム、更に関連する相対度数や累積度数について解説します。 度数分布(度数分布表)とは 度数分布とは、データの集まりの特徴を把握でき、階級と度数を整理したもののことです。 こちらの表は、あるクラスの得点と人数について度数分布をまとめた度数分布表になります。階級とは、データを区切る範囲のことで、ここでは、10点刻みの得点の範囲 […]

様々な量的変数(離散変数/連続変数/パネルデータ/時系列データ/クロスセクションデータ)

この記事では、こちらの記事で解説をした量的変数の別の分類について説明をします。まずは、離散変数と連続変数についてです。 離散変数と連続変数 離散変数 離散変数とは、簡単にいうと「間に値を取らない数値」です。例えば、「コインを5回投げて表が出る回数」といった、結果が「1回」や「2回」といったとびとびの値を取る変数です。 連続変数 一方、連続変数は、「間に無限に値がある数値」のことをいい、例えば、身長 […]

グラフの種類とその特性を理解して効果的なプレゼンをしよう!

この記事では、様々なグラフ表現についてみていきます。グラフ表現については、普段皆さんがお仕事をする中で、エクセル等で作成し馴染みがあるものがほとんどかと思います。しかし、改めて、各グラフの特徴と最適な活用シーンを理解することで、資料作成に迷いがなくなり、より効果的なプレゼンで相手を説得することにつながります。 棒グラフ まず棒グラフについては、数値の大小比較を行う時に主に使用されます。例えばこの棒 […]