復習 ── 中1で学んだデータの整理
- 平均値:データの和 ÷ 個数
- 中央値(メジアン):データを並べたときの中央の値
- 最頻値(モード):一番多く出てくる値
- 範囲:最大値 − 最小値
- 中2では、これに 四分位数を加える
四分位数の定義
第1四分位数 Q₁:下位 25% の位置(下から1/4)
第2四分位数 Q₂:中央値(50% の位置)
第3四分位数 Q₃:上位 25% の位置(75% の位置)
四分位数の求め方
① データを 小さい順に並べる
② 全体の 中央値 Q₂ を求める
③ 中央値より 下半分の中央値 → Q₁
④ 中央値より 上半分の中央値 → Q₃
→ データが Q₁、Q₂、Q₃ で4つのグループに分かれる
奇数個のデータ ── 例
並んでいる、データ数 7
中央値 Q₂ = 8(4番目、中央のデータ)
下半分:2, 5, 7(3個)→ 中央 → Q₁ = 5
上半分:12, 15, 18(3個)→ 中央 → Q₃ = 15
→ 4つに分かれる:(2,5)、(5,8)、(8,15)、(15,18)
偶数個のデータ ── 例
データ数 6 → 中央値は 3番目と4番目の平均
中央値 Q₂ = (7+9)/2 = 8
下半分:3, 5, 7(3個)→ Q₁ = 5
上半分:9, 11, 13(3個)→ Q₃ = 11
データ:4, 6, 7, 9, 10, 12, 14, 16
中央値 Q₂ = (9+10)/2 = 9.5
下半分(前半4個):4, 6, 7, 9 → Q₁ = (6+7)/2 = 6.5
上半分(後半4個):10, 12, 14, 16 → Q₃ = (12+14)/2 = 13
四分位範囲(IQR)
データの 中央 50% の散らばりを表す。
外れ値の影響を受けにくい指標。
Q₁ = 5、Q₃ = 15 → 四分位範囲 = 15 − 5 = 10
→ データの中央 50% は 5〜15 の範囲に収まる
「範囲」と「四分位範囲」の違い
範囲 = 最大値 − 最小値(外れ値の影響を受けやすい)
四分位範囲 = Q₃ − Q₁(外れ値の影響を受けにくい、中央50%)
例:1, 5, 6, 7, 8, 9, 100
範囲 = 100 − 1 = 99(100 の影響大)
四分位範囲 = 9 − 5 = 4(外れ値の100が含まれない)
→ 外れ値があるデータでは四分位範囲のほうが信頼できる
外れ値とは
他のデータから極端に離れた値
慣例的な判定基準:
Q₁ − 1.5 × IQR より小さい値
Q₃ + 1.5 × IQR より大きい値
→ これに該当すれば外れ値の可能性
5数要約
5数要約:最小値、Q₁、Q₂(中央値)、Q₃、最大値
例1の場合:2、5、8、15、18
これでデータの分布の概要が分かる
→ 次回学ぶ「箱ひげ図」のもと
- 奇数個:中央のデータがそのまま中央値
- 偶数個:中央の2つの平均が中央値
- 上下に分けたときも同じルール
- 分け方を間違えると四分位数が変わる
- 奇数個のとき、上半分・下半分に中央値を 含めない
- 例:データ 2,5,7,8,12,15,18 → 中央値 8 を除き、下半分 2,5,7、上半分 12,15,18
- この教材では教科書に合わせて、この方式で統一する
- データはまず 昇順に並べる
- 順番に並んでいないと、Q₁ や Q₃ の位置が分からない
- 並べ替えを忘れずに
練習問題
データ:5, 8, 10, 12, 15, 18, 22 で Q₁, Q₂, Q₃ を求めよ。
答えを見る
データ数 7
Q₂ = 12(中央)
下半分 5, 8, 10 → Q₁ = 8
上半分 15, 18, 22 → Q₃ = 18
問題1のデータの四分位範囲を求めよ。
答えを見る
Q₃ − Q₁ = 18 − 8 = 10
データ:4, 6, 8, 10, 12, 14 で Q₁, Q₂, Q₃ と四分位範囲を求めよ。
答えを見る
データ数 6
Q₂ = (8+10)/2 = 9
下半分 4, 6, 8 → Q₁ = 6
上半分 10, 12, 14 → Q₃ = 12
四分位範囲 = 12 − 6 = 6
データ:3, 5, 7, 8, 10, 12, 15, 18, 20 の5数要約を答えよ。
答えを見る
データ数 9、中央値 Q₂ = 10(5番目)
下半分 3,5,7,8 → Q₁ = (5+7)/2 = 6
上半分 12,15,18,20 → Q₃ = (15+18)/2 = 16.5
5数要約:最小 3、Q₁ 6、Q₂ 10、Q₃ 16.5、最大 20
まとめ
- 四分位数:データを 4等分する3つの値(Q₁, Q₂, Q₃)。
- Q₂ = 中央値(メジアン)。
- 四分位範囲 = Q₃ − Q₁(中央50%の散らばり)。
- 外れ値の影響を受けにくい散らばりの指標。
- 5数要約:最小、Q₁、Q₂、Q₃、最大。
- 箱ひげ図(次回)の基礎となる。