平均値と中央値の違いとは
データの指標等でよく表記されるものに『平均値』『中央値』という数値があります。
平均値についてはなんとなく聞いたことがあると思いますが、中央値に関しては聞いたことはあっても意味は分からないという人も多いのではないでしょうか。
様々な統計データを見たり扱ったりするにあたって、知っておいた方がいい言葉なのは間違いないので、これらの数値について解説していきます。
平均値だけではなく中央値の意味を知っておくことで、多方面から統計データを見ることができるようになります。
平均値の意味や特徴とは
平均値は観測値の総和を用いるので全ての値が反映されます。
どれか1つの数値が変化するだけでも平均値は変化するので、平均値はデータの総合的な変化を比較する時に使うべき数値です。
1つの数値に影響されるので、その1つの数値で平均値が大きく変化します。
たとえば、5人の平均年収データを出す場合を想定して平均値を計算してみましょう。
- Aさん:年収300万円
- Bさん:年収350万円
- Cさん:年収400万円
- Dさん:年収450万円
- Eさん:年収1億円
この5人の平均値は、年収が非常に高いEさんによって跳ね上がってしまいます。
- Eさん無し:375万円
- Eさん有り:約2,000万円
Eさん無しだと平均値が375万円に対して、この5人の年収の平均値は約2,000円ということになり、年収の現実・実態を表せているとは言い難い数値になってしまいます。
A~Dさんにしてみれば『俺、2,000万円も貰ってねーよ』と言いたくなるほど有り得ない数値になるので、この場合は平均値を求めるのは適切ではありません。
中央値の意味や特徴とは
中央値はデータを小さい順または大きい順に並べた時に中央に位置する値が反映されます。
どれかの数値が他の数値と比べて大きく外れていたとしても、順番に並べた数値の中央の数値が反映されるので、現実離れした数値になりにくい特徴があります。
ですが、多数決で多いほうが勝つ理論に近いものがあり、少数派の数値がかき消されてしまうというデメリットがあります。
たとえば、6人の中央年収データを出す場合を想定して中央値を計算してみましょう。
- Aさん:年収300万円
- Bさん:年収350万円
- Cさん:年収400万円
- Dさん:年収450万円
- Eさん:年収1億円
この6人の年収の中央値はEさんの数値が全く反映されなくなります。
- 中央値:400万円
平均値と中央値の使い分け
- 年収:中央値が適切か
- 貯金:中央値が適切か
- 身長:平均値が適切か
- 体重:平均値が適切か
- テストの点数:平均値が適切か
平均値は極端な数値があった場合でも考慮してしまうので、大きすぎる数値や小さすぎる数値の影響を大きく受けてしまいます。
中央値は大きすぎる数値や小さすぎる数値が含まれていたとしてもほとんど影響を受けませんが、吐出した数値は無視されてしまいます。
というわけで、平均値と中央値の使い分け方法は、平均値と中央値の両方のデータを出してみたうえで現実や実態と大きくずれていなければ平均値を使うのが適切だと思われます。
まとめ
平均値は観測値の総和を用いるので全ての値が反映されます。
データの総合的な変化を比較する時に効果的ですが、異常な数値が入り込むと現実離れした数値になってしまうデメリットも。
中央値はデータを小さい順または大きい順に並べた時に中央に位置する値が反映されます。
どれかの数値が他の数値と比べて大きく外れていたとしても影響を受けない反面、少数派の数値が無かったことになってしまうデメリットも。
平均値と中央値にはそれぞれメリット・デメリットがあり、扱うデータの種類によって使い分ける必要があります。
研究のデータを解析する時や発表された統計データをチェックする時には、平均値と中央値の特徴をよく理解したうえで目を通すことをおすすめします。
コメント