変動係数とは?大きさの異なるデータを比較しよう!

統計学

この記事では、変動係数について解説をします。まず、具体的な課題をもとに変動係数の意義について理解していきましょう。

変動係数とは?具体例で解説

ここにA社とB社という会社があり、A社の平均月間売上は1億円、B社の平均月間売上は300万円だったとします。また、各社の月間売上について、データのバラつきを表す指標である標準偏差は、A社が1000万円、B社が200万円。つまりA社は月間売上が平均の1億円を基準に1000万円のバラつきがあるので、9000万円〜1億1千万円というバラつきとなっており、B社は平均の300万円を基準に100万円〜500万円というバラつきとなっています。このときどちらの会社の売上のバラつきが大きいと言えるでしょうか?

一見、金額規模が大きいA社の方がバラつきも大きく感じますが、このようにデータの規模が異なり比較が困難な場合に役立つのが「変動係数」です。

変動係数(CV)の求め方

変動係数はデータのバラつきの大きさを比率で表して比較することができる指標です。「標準偏差➗平均」で求められます。英語で Coefficient of Variation というので「CV」と訳されます。

変動係数で表すと、A社が0.1 B社が0.67となります。値が大きいB社の方がデータのバラつきは大きいことがわかります。

標準化との違い:異なる大きさ同士の比較のまとめ

標準化(基準化)は、偏差を標準偏差で割り、データを無次元化して、平均との差で比較をします。「無次元化」とは、簡単にいうと、データの規模や単位などの次元が異なり比較ができない状態から次元を無くして比較できる状態にすることを意味します。

標準偏差の代表例の偏差値は、平均が50になるように標準化をしています。そして偏差値を平均50を基準にして差を見て結果の良し悪しを評価します。

一方、変動係数は、標準化と同様に標準偏差を平均で割ることでデータを無次元化していますが、変動係数の場合は、比率で比較をしています。これにより、変動係数の場合は、比例尺度で扱うことができますが、比で表すことができない、間隔尺度では、使えいないという点に注意しましょう。比例尺度、間隔尺度については、こちらの記事で扱っています。

動画解説

本記事で解説した内容は、こちらの動画でも解説しています。よかったらご視聴ください。

タイトルとURLをコピーしました