因子分析とは?
因子分析とは、変数の背後にある潜在的な要因を発見する分析手法です。 例えば、わかりやすい例が、国語や数学などの成績の背後には、「文系力」や「理系力」という潜在的な要因が隠れている、といった話です。まずは、この教科(ここでは、国語、社会、英語、理科、数学の5教科)を例に因子分析の概要を解説していきます。
実際に私たちが目にしている、変数である国語、社会、英語、理科、数学の各成績(テストの点数)を「観測変数」と言います。この観測変数は、2種類の因子から構成されており、先ほども例示した「文系力」、「理系力」という複数の観測変数に共通する「共通因子」と観測変数それぞれが持つ(国語の点数であれば、国語そのものに対して有する能力で、他の変数とは関係がないもの)「独自因子」から構成されています。
また、共通因子には、その共通因子が及ぼす影響力を示した「因子負荷量」と呼ばれる係数が掛かります。これを式で表すと、次のようになります。
観測変数 = 因子負荷量 ✖️ 共通因子 + 独自因子
分析手順
因子分析の実行の流れを解説します。
① 共通因子の数を決める
因子分析では、予め因子(共通因子)の数を定めて分析を行います。因子の数は、分析者自らが仮説を持って設定することもあれば、「固有値」を計算し、固有値が1以上の数を因子数としたり、固有値を大きい順に並べて、値が大きく減少する段階までをの数を因子数と定めるとった推定方法があります。
※固有値は、変数の情報量の大きさ(分散の大きさ)を表し、主成分分析や因子分析において用いられる指標です。固有値が大きいほど重要な成分といえます。
② 因子負荷量を求める
因子負荷量とは、共通因子が、観測変数に及ぼしている影響力の強さを示しています。その算出方法には、主因子法や最尤法など複数の解法がありますが、因子の結果の解釈のしやすさを探索しながら推定していきます。
③ 軸の回転後の因子負荷量を求める
共通因子の特徴をより明確にし、意味を解釈するために軸の回転を行います。
軸の回転方法には、2種類、「直行回転」と「斜交回転」があります。
回転の種類 | 最も有名な例 | 回転の特性 |
直行回転 | バリマックス法 | 回転後も因子同士が無相関で直行した状態を維持 |
斜交回転 | プロマックス法 | 因子間の相関を許容 |
④ 因子得点を求める
因子得点は、各個体における共通因子の値であり、5教科の例で言うと、各生徒の共通因子(文系力と理系力)の値になります。因子得点により、各生徒の特徴を知ることができます。因子得点の解法も複数あり、回帰法などが有名です。
因子分析結果の読み方
統計ツールやRなどのプログラミングを用いて因子分析を行うと、共通性や寄与率などいくつかの指標が得られます。各指標についての意味や見方について解説をしていきます。ここでは、よりマーケティングの実務に近い事例で、スマートフォン商品に関するアンケート結果をもとに消費者の潜在意識の分析を行うというテーマで見ていきましょう。
因子負荷量
先ほどの分析手順の中でも登場した因子負荷量は、共通因子が観測変数に与える影響力を示す指標のことでしたね。因子分析では、この因子負荷量を求めることが最大の目的といわれ、因子負荷量の結果を見て、因子名を決定しています。例えば、下図の例では、「おしゃれ」「信頼できる」という項目の因子負荷量が高い、因子1を「ブランド力」としています。
共通性/独自性
「共通性」は、観測変数が、共通因子によってどれだけ説明されているか(割合)を示します。下図のように各因子の負荷量を二乗和したものが共通性の値になります。また、「独自性」は、1-共通性で求めます。
因子寄与/因子寄与率
「因子寄与」は、共通因子が観測変数に対してどの程度寄与しているかという指標になります。「 因子寄与率」は、因子寄与を割合で表したものです。
主成分分析との違い
最後に、要因分析と似たコンセプトの主成分分析との違いについて解説をします。主成分分析と因子分析の構造を図で表すと下図のようになります。
図をご覧いただいてわかる通り、これらは非常によく似ていますが、その分析の目的が異なります。因子分析は、この記事の冒頭でも説明をした通り、「変数の背後にある潜在的な要因を発見すること」でした。そのため図でも、潜在要因である共通因子が、どれだけ各観測変数に対して影響をしているかという方向で矢印が示されています。一方で、主成分分析は、その逆です。観測変数をもとに文系力、理系力という主成分を合成して新たに作り出している、という方向で矢印が示されています。このようなコンセプトで主成分分析は、多すぎる変数を要約し、変数を減らしたり(次元削減・次元圧縮)、第1主成分である「総合評価」をもとに人気企業ランキング等で使われたりする分析手法となっています。
この記事では、統計解析の代表的な手法の1つである主成分分析(Primary Component Analysis: PCA)について解説をしています。主成分分析は、マーケティングなど様々なビジネスシーンで用いられる解析手法です。多くのビジ[…]