なぜ整理が必要?
例えばクラス29人の身長データが「150, 162, 158, 145, 167, …」と並んでいたとして、どこに集中しているか・大きい人や小さい人がどれくらいいるかをパッと見で判断できません。
そこで 「ある範囲ごとに何人いるか」 をまとめた表を作ると、データの全体像が見えるようになります。これが 度数分布表です。
度数分布表の用語
用語
階級(かいきゅう)
データを区切る範囲。例:「150cm以上 155cm未満」「155cm以上 160cm未満」など。
用語
階級の幅
階級1つの 大きさ。「150〜155」なら幅は5。すべての階級で同じ幅にする。
用語
度数(どすう)
それぞれの階級に 何個(何人)データがあるか。
用語
階級値(かいきゅうち)
階級の 真ん中の値。例:「150以上 155未満」の階級値は 152.5(後で平均値の計算で使う)。
度数分布表の例
度数分布表の作り方
4ステップで作る
- データの最大・最小を見る:例 140〜164cm
- 階級の幅を決める:例 5cm(データ数が多いほど大きく、少ないほど小さく)
- 階級を作る:「140以上145未満」のように 「○○以上 △△未満」で書く(同じ値の重複を防ぐ)
- 各階級の度数を数える:データを1つずつ振り分ける
「以上」「未満」の使い分け
境界値はどちらに?
- 「150以上 155未満」と書けば、150 はこの階級に入る、155 は次の階級に入る。
- こうすることで、ちょうど境界の値が どちらか一方だけ に入る(重複しない)。
- 「以下」を使うと境界が両方に入ってしまうので、度数分布表では 「以上 〜 未満」が標準。
適切な階級の幅
- 小さすぎると階級が増えすぎて、表が大きくなりすぎる
- 大きすぎると階級が少なすぎて、データの特徴が見えなくなる
- 目安:階級が 5〜10個くらいになる幅を選ぶ
練習問題
問題1(用語)
次の用語の意味を答えなさい。
- 階級
- 階級の幅
- 度数
- 階級値
答えを見る
(1) 階級:データを区切る範囲(区間)。
(2) 階級の幅:階級1つの大きさ(区間の幅)。すべての階級で同じ。
(3) 度数:それぞれの階級に含まれるデータの個数(人数)。
(4) 階級値:階級の真ん中の値。
問題2(階級値)
次の階級の階級値を求めなさい。
- 40 以上 50 未満
- 155 以上 160 未満
- 0 以上 10 未満
答えを見る
(1) (40+50)÷2 = 45
(2) (155+160)÷2 = 157.5
(3) (0+10)÷2 = 5
問題3(境界値)
「150以上 155未満」「155以上 160未満」の2つの階級がある。次のデータはどちらの階級に入るか。
- 153
- 155
- 159.5
答えを見る
(1) 150以上 155未満(150〜155のあいだ)
(2) 155以上 160未満(155は「155以上」に入る、未満は含まない)
(3) 155以上 160未満(159.5は160未満)
まとめ
- たくさんのデータを把握するための表が 度数分布表。
- 4つの用語:階級・階級の幅・度数・階級値。
- 階級の書き方は 「以上 〜 未満」。境界値の重複を防ぐ。
- 階級値 = 階級の真ん中の値(後で平均値計算に使う)。
- 階級の数は5〜10個が目安。