質的変数・量的変数と4つの尺度について具体例をもとに分かりやすく違いを解説!

この記事では、統計学で扱われるデータの種類について解説していきます。

変数とは

まずデータの中には、皆さんもよく耳にしたことがある変数というものがあります。変数とは一言でいうと「定まっていないデータ」のことです。「定まっていない」ということなので、対義語は「定まっているデータ」つまり「定数」になります。

そして、この変数は、大きく2つに分類できます。それが、「質的変数」と「量的変数」です。

質的変数と量的変数

「質的変数」とは、これも一言で表すと「数値でないデータ」ということです。例えば、性別(男か女か)や名前(太郎さん、花子さん)のようなデータ(情報)のことをいいます。
一方、「量的変数」は「数値データ」のことで、例えば身長や温度など数値で表せる情報になります。

まずこの「質的変数」と「量的変数」の大きく2つの種類があることを抑えましょう。

4つの尺度(名義尺度/順序尺度/間隔尺度/比例尺度)

次に質的変数と量的変数について、さらに「尺度」というものでの分類をみていきます。まず質的変数に関して、名義尺度と順序尺度というものがあります。

名義尺度

名義尺度は、先ほどの質的変数の例に出ていたような性別や名前など、単にカテゴリを表す「数値でない」データです。

順序尺度

それに対して順序尺度は、数値ではないですが、順序がある質的変数になります。例えばランキングが順序尺度です。ランキング1位は5位よりもランクが高いといった大小比較ができる、つまり順序がある変数になります。

順序尺度は、数値である、数値でない。の判断が少し難しく感じますが、ランキングは数値ではありません。例えばですが、ランキングの順位では平均値は出せません。1〜5位の平均は「3位」とは計算できないことからランキングの数字には数値的な意味はないことがわかります。

間隔尺度

次に量的変数についてです。まず間隔尺度は、数値データではありますが、「0」に意味をなさない量的変数になります。つまり「0=ない」という意味ではないものをいいます。
例えば、温度や西暦です。0度は温度がないという意味ではなく、相対的な温度として0度と表されています。西暦も「西暦0年」は「ない」という意味ではありません。

比例尺度

最後に比例尺度です。比例尺度は、間隔尺度に対して0に意味がある量的変数です。つまり「0=ない」という意味になる尺度です。
例えば、値段や身長は0のとき値段であれば無料ですし、身長であれば身長が存在しないことを意味します。

また比例尺度というように「比」、つまり何倍ということも表すことができます。例えば、身長2mの人は1mの人の2倍と表すことができます。先ほどの間隔尺度の西暦では、比は取れません。西暦2000年は西暦1000年の2倍ということは言えないからです。

以上、4つの尺度についてでした。質的変数、量的変数の判別や尺度の判別は瞬時に判断ができるようにしておかないと迷うものもあります。ここでご説明したような観点で判断ができるようにしておきましょう

動画解説

こちらの記事の内容は下記の動画でも学ぶことができます。よろしければご視聴ください。