「データドリブン」の時代には必須の知識…統計で用いられる「尺度」や「変数」とは何か説明できますか?

AI要約

算数の基礎から学び直すために、算数の重要な考え方について学ぶ連載記事。

データの尺度や変数について詳しく解説し、名義尺度、順序尺度、間隔尺度、比例尺度の違いを明確に説明。

データを4つの尺度に分類するスティーブンスの提案やデータの見方について解説。

「データドリブン」の時代には必須の知識…統計で用いられる「尺度」や「変数」とは何か説明できますか?

 食塩水の濃度や往復の平均速度など、仕事などでちょっとした算数の知識が問われる場面に出くわして、ドキッとしたことはないだろうか。「昔は解けたのに……」、そう思うのに解けない。そんな大人たちは本連載で今一度、算数を基礎から学び直してみてはどうだろう。

 長年、算数・数学教育に携わってきた桜美林大学名誉教授・芳沢光雄氏の新刊『大人のための算数力講義』(講談社+α新書)より抜粋して、「算数の重要な考え方」をお届けする。

 『大人のための算数力講義』連載第7回

 『一人前の社会人なら知っておきたい…経済格差問題で頻出の「ジニ係数」について完璧に理解しよう! 』より続く

 統計で用いるデータについて、少し詳しく見てみよう。

 まず具体的に、各人を説明するいくつかの情報をまとめた次のものを考える。

 (ア,イ,ウ,エ,オ,カ,キ,ク)

 アは名前、イは血液型、ウは国語の成績(優・良・可・不可による評価)、エはラーメンの好き嫌い(1…好き、2…どちらでもない、3…嫌い)、オは生まれた西暦年数、カは快適と感じる部屋の温度(℃)、キは毎月のお小遣い(円)、クは身長(cm)とする。たとえば、

 (田中一郎, A, 良, 1, 2002, 23, 27000, 165)

 は、次のことを意味する。

----------

名前は田中一郎、血液型はA型、国語の成績は良、ラーメンは好き、生まれたのは西暦2002年、快適と感じる部屋の温度は23℃、毎月のお小遣いは27000円、身長は165cm。

----------

 最初の二つの変数である名前と血液型は、ラベルにある名称のようなもので、それ自身に順序のようなものはない。このような変数を名義尺度という。もちろん、田中一郎+鈴木太郎のような足し算や、A型×AB型のような計算は何もできないことに注意する。

 次の二つの変数である国語の成績とラーメンの好き嫌いは、ラベルにある名称のようなものであるものの、どちらも順序がある。このような変数を順序尺度という。

 ここでの変数に関しては、順序はあっても、優-可という引き算や、{1(ラーメン好き)+3(ラーメン嫌い)}÷2という計算は何もできないことに注意する。

 次の二つの変数である生まれた西暦年数と快適と感じる部屋の温度は、目盛が等間隔になっているもので、田中さんの2002年より12年前に生まれた人は1990年であったり、快適と感じる部屋の温度が24℃の人は田中さんの23℃より1℃高かったりするように、変数に関して足し算や引き算ができる。

 このような変数を間隔尺度というが、2002(年)÷2=1001(年)や、23(℃)×2=46(℃)のような計算を見ても分かるように、掛け算や割り算は意味がないことに注意しよう。

 最後の二つの変数である毎月のお小遣いと身長は、間隔尺度の性質ばかりでなく、それぞれの何倍や何%増などの計算が意味をもっている。このような変数を比例尺度という。

 ここで紹介した四つの尺度に関して、名義尺度と順序尺度を合わせて質的変数といい、間隔尺度と比例尺度を合わせて量的変数という。

 ちなみに、このようにデータを四つの尺度に分類する考え方を提案したのはスティーブンスという心理学者で、1946年のことである。そして現在でも、この分類によってデータを見るのが一般的である。

 『高校の数学教師ですら間違える⁉「逆に言うと…」というセリフを多くの人が間違えて使ってしまうワケ』へ続く