3つの代表値
個数が奇数なら真ん中の1つ、偶数なら 真ん中2つの平均。
例で計算してみる
平均値:(60+70+70+80+100) ÷ 5 = 380 ÷ 5 = 76点
中央値:小さい順に並べると 60, 70, 70, 80, 100 → 真ん中は 70点
最頻値:70が2回出る(他は1回)→ 70点
平均:(50+60+70+80+90+100) ÷ 6 = 75点
中央:真ん中2つ 70, 80 の平均 = 75点
最頻:すべて1回ずつ → 最頻値なし(または全員)
3つの代表値の使い分け
外れ値の影響
25, 28, 30, 30, 500 ← 最後の人だけ突出
平均:(25+28+30+30+500)÷5 = 122.6万円 ← 1人の影響で大きくなる
中央値:30万円 ← 「ふつうの月収」に近い
最頻値:30万円
このように 極端な値(外れ値)があるとき、平均値だけ見ると実態とズレることがあります。中央値や最頻値も合わせて見るのが大事。
範囲(はんい、レンジ)── データの広がり
最大値 100、最小値 60 → 範囲 = 100 − 60 = 40
同じ平均値でも、範囲が違えば データの広がり方が違います。これは中2で学ぶ「ばらつき」の入り口の概念。
度数分布表からの代表値
- 平均値:(階級値 × 度数)の合計 ÷ 全体の度数
- 中央値:累積度数を見て、真ん中の人がどの階級にいるかを答える
- 最頻値:度数が最も大きい階級の 階級値
- 中央値の偶数個の場合:真ん中が2つあるので、その2つの 平均を取る。
- 「最頻値なし」の場合:すべて1回ずつなら最頻値はない(または「決定不能」)。
- 「最頻値が複数」の場合:同じ最大度数が複数あれば、最頻値も複数(バイモーダルなど)。
練習問題
データ:4, 6, 8, 8, 10, 12, 14(7個)
答えを見る
平均:(4+6+8+8+10+12+14)÷7 = 62÷7 ≒ 8.86(または62/7)
中央:真ん中(4番目) = 8
最頻:8(2回出る、他は1回)
範囲:14 − 4 = 10
答えを見る
中央:真ん中2つ(5と7)の平均 = (5+7)÷2 = 6
最頻:5(2回)
答えを見る
解答例:平均値が中央値より大きいということは、データの中に 非常に高い値(外れ値)が含まれている可能性が高い。例えば一部の超高所得者の年収が平均を引き上げている。「ふつうの人の年収」を知りたければ、中央値の400万円のほうが実態に近い。平均値だけでは正確な判断ができない例。
まとめ
- 3つの代表値:平均値・中央値・最頻値。場面で使い分け。
- 平均値は外れ値に弱い。極端な値があるときは 中央値も見る。
- 中央値(偶数個)は真ん中2つの平均。
- 範囲=最大値 − 最小値。データの広がり。
- 度数分布表からは、階級値を使って近似的に代表値を求める。