この記事では、相関関係について解説をします。
相関とは(正の相関、負の相関、無相関)
相関とは、変数同士の関係性を表したもので、例えば2つの変数の関係性を散布図で表すと大きく3つの関係性に大別することができます。
一番左が、正の相関で、「一方の変数が増えたとき、もう一方の変数も増える」という関係性をいいます。図としてはこのように右肩上がりに散布図が表現されます。
次に負の相関は「一方の変数が増えたとき、もう一方の変数は減る」という関係性をいい、散布図は右肩下がりとなります。
そして最後に無相関はその名の通り、相関関係がないもののことをいいます。
また、一見、無相関に見えても、グループを分けて相関を見ると相関性がみられることもあります。このようにグループごとに分けた散布図を層別散布図といいます。
相関と因果の違い
次に、相関とよくセットで語られることが多い「因果」について解説します。
相関(相関関係)とは、おさらいになりますが、簡単に言うと「AとBに関連性があること」を言いました。例えば、「Aが増えるとBも増える」といった関係にあることです。
一方、因果(因果関係)はというと、「Aが原因となりBが起きること、または変化すること」をいいます。要は、「AとBの関係に根拠があること」をいいます。
この違いを念頭において、次の3つのケースについて考えてみましょう。
問題:次のケースは、相関関係か因果関係か、もしくは両方なのか。について考えてみましょう。
- 気温が上がるとアイスクリームの売上が増える
- 気温が上がるとおでんの売上が減る
- アイスクリームが売れるとおでんが売れなくなる
解答解説
まず最初の「気温が上がるとアイスクリームの売上が増える。」これは、「気温が上がるとアイスの売上が増えている」ので、正の相関関係がみられます。また、「気温が上がることで冷たいアイスを食べたくなる人が増えた。」→「(その結果)アイスの売上が増えた。」という根拠が言えるので、因果関係であると言えます。
2点目の「気温が上がるとおでんの売上が減る」も同様ですね。「気温が上がったことで、熱々のおでんを食べたいという人が減る」→「売上が減少した。」という状況は、負の相関関係がみられ、また因果関係もあると言えます。
最後はどうでしょうか。「アイスクリームが売れるとおでんが売れなくなる」これは負の相関関係がみられますが、「アイスクリームの売上が増えた」→「おでんの売上が減った」ということは直接的な根拠が言えません。つまり因果関係はありません。これは次の章で解説する「擬似相関」と言われる「見せかけ上の相関」に該当します。
解答まとめ
- 気温が上がるとアイスクリームの売上が増える(相関/因果)
- 気温が上がるとおでんの売上が減る(相関/因果)
- アイスクリームが売れるとおでんが売れなくなる(相関)
このように相関関係がみられても、その相関には因果関係があるのかを疑って見ないと誤った分析や予測につながる恐れがあります。
最後に相関と因果の関係性について補足です。相関と因果の関係は図で表すとこのようなイメージとなり、相関が因果を包含している関係になります。
この図から「因果関係があれば、相関関係がある」と言えますが、「相関関係があっても因果関係はない場合がある」と言うこともわかるかと思います。
擬似相関とは
次に「擬似相関」について解説します。
擬似相関(擬相関)とは、一見、相関関係があるように見えるが、実際は別の要因があることをいい、「見せかけ上の相関」という言われ方もします。
前章で例としてみた、おでんとアイスクリームの売上の関係も擬似相関に当たります。一見、アイスの売上が増加するとおでんの売上が減少するので負の相関関係があるようにみられますが、実はここには「気温」という別の変数(「第3の変数」)があり、実は気温がそれぞれと相関関係を持っていることで、おでんとアイスに相関があるように見えてしまっていたのです。
擬似相関であるにもかかわらず2つの変数に相関があると判断し、分析や予測を行うと誤ったビジネス上の判断をしてしまう恐れがあります。擬似相関を避けるには、因果関係が変数間にあるかを疑って見ることが大切です。
動画解説
本記事で解説した内容は、こちらの動画でも解説しています。よかったらご視聴ください。