復習のポイント
- 四分位数:データを4等分する3つの値(Q₁、Q₂、Q₃)
- Q₂ = 中央値(メジアン)
- 四分位範囲 = Q₃ − Q₁(中央50%の散らばり)
- 箱ひげ図:5つの値(min, Q₁, Q₂, Q₃, max)で作る
- 箱の長さ = 四分位範囲
- 外れ値:他のデータから極端に離れた値
- 平均値は外れ値の影響大、中央値は影響小
解く前にそろえる型
- 四分位数は、まずデータを小さい順に並べてから求める。並べ替えを省くと、中央値もQ1・Q3もずれる。
- データの個数が奇数のとき、Q1・Q3を求める上下半分には中央値を含めない扱いで統一する。
- 箱ひげ図は「最小値、Q1、中央値、Q3、最大値」の5数要約を数直線上に置く図。箱の長さだけで全範囲を判断しない。
- 比較問題では、中央値で中心、四分位範囲で中央50%の散らばり、最大値・最小値で端の広がりを見る。
例:7個のデータ 2, 4, 6, 8, 10, 12, 20
中央値Q2は4番目の8。下半分は2,4,6なのでQ1=4、上半分は10,12,20なのでQ3=12。
四分位範囲は 12−4=8。範囲は 20−2=18。外れ値の影響を受けやすいのは範囲のほう。
A 基本用語(10問)
- 四分位数とは何か
- 第2四分位数は何の別名か
- 箱ひげ図に使う5つの値
- 箱の長さは何を表すか
- 外れ値とは
- 外れ値の影響を受けやすいのは平均値か中央値か
- 四分位範囲は何を測るか
- 箱ひげ図のひげの長さは何を示すか
- 「同じくらい」の中央値で四分位範囲が大きい方が散らばりが大きいか小さいか
- 箱ひげ図とヒストグラム、複数データの比較に向くのは
答えを見る
(1) データを4等分する3つの値(Q₁、Q₂、Q₃)
(2) 中央値(メジアン)
(3) 最小値、Q₁、Q₂(中央値)、Q₃、最大値
(4) 四分位範囲(中央50%の散らばり)
(5) 他のデータから極端に離れた値 (6) 平均値
(7) 中央50%の散らばり (8) 全体の散らばり(端のデータまでの距離)
(9) 散らばりが大きい (10) 箱ひげ図
B 計算(10問)
- データ 3, 6, 8, 10, 12, 14, 18 の中央値
- 同データの Q₁
- 同データの Q₃
- 同データの四分位範囲
- データ 5, 7, 9, 11, 13, 15 の中央値
- 同データの四分位範囲
- データ 2, 4, 6, 8, 10, 12, 14, 16 の Q₂
- 同データの Q₁
- 同データの Q₃
- 同データの最大値・最小値
答えを見る
(1) 10 (2) 6 (3) 14 (4) 8(=14−6)
(5) (9+11)/2 = 10 (6) Q₁=7, Q₃=13、四分位範囲=6
(7) (8+10)/2 = 9 (8) (4+6)/2 = 5 (9) (12+14)/2 = 13
(10) 最大=16、最小=2
C 箱ひげ図の読み取り(5問)
- あるデータの5数要約:min=5, Q₁=10, Q₂=15, Q₃=20, max=25。四分位範囲
- 同データの全範囲
- 中央50%のデータがある範囲
- 2つのクラスの中央値:A=70、B=65。どちらが点数高い
- 四分位範囲:A=10、B=20。どちらが散らばり大
答えを見る
(1) 20−10 = 10 (2) 25−5 = 20 (3) 10〜20
(4) A(中央値が高い) (5) B(IQR大)
D 応用・比較(5問)
- 平均値と中央値、外れ値があるとき代表値としてどちらが信頼できる
- 「中央値が同じ=散らばりも同じ」と言えるか
- 2クラスのテスト:A の中央値70、B の中央値75、IQR A=10、B=15。どう判断
- 箱ひげ図で「中央値が箱の左寄り」だと、データはどう分布
- 四分位範囲の1.5倍を超える値が外れ値の目安。Q₁=10、Q₃=20 のとき外れ値の境界
答えを見る
(1) 中央値(外れ値の影響を受けにくい)
(2) 言えない(散らばりは四分位範囲を見ないと分からない)
(3) B は全体的に高得点だが、A の方が均一
(4) データが左に集まり、右に長く裾を引く(右に長い分布)
(5) IQR = 10、Q₁ − 1.5×10 = −5 より小、Q₃ + 1.5×10 = 35 より大
テスト前のチェックリスト
- □ データを昇順に並べる
- □ 中央値の位置(奇数個・偶数個で違う)
- □ Q₁ = 下半分の中央値、Q₃ = 上半分の中央値
- □ 四分位範囲 = Q₃ − Q₁
- □ 箱ひげ図の5つの値
- □ 平均値と中央値の使い分け
- □ 外れ値の判定基準(IQR の1.5倍)
- □ 複数データの比較は箱ひげ図で
つまずきポイントの再確認
- 偶数個のデータ:中央値は中央2つの平均
- 中央値の位置:n が奇数なら (n+1)/2 番目、偶数なら n/2 と (n/2)+1 の平均
- 上下半分の分け方:奇数個のときは中央値を除いて分ける
- 散らばりの指標:範囲は外れ値の影響大、四分位範囲は影響小