復習のポイント
- 全数調査:母集団全体を調べる(国勢調査・学校の身体測定など)
- 標本調査:母集団から一部を取り出して推定(視聴率・世論調査など)
- 無作為抽出:偏りなく標本を選ぶ(くじ引き・乱数表)
- 推定の公式:母集団中の対象数 = 母集団の大きさ × (標本中の対象数 / 標本の大きさ)
- 捕獲再捕獲法:印をつけて放ち、再捕獲数から推定
標本調査の計算を始める前に
- 母集団は調べたい全体、標本はそこから取り出した一部。どちらの大きさを聞かれているかを先に確認する。
- 推定では、標本の割合が母集団にもほぼ当てはまるとみなして計算する。
- 標本は無作為に選ぶ。取り出し方に偏りがあると、標本数が多くても推定は信頼しにくい。
- 全数調査は正確だが時間や費用がかかる。標本調査は速いが誤差を含む。
製品1200個から無作為に60個を調べ、3個が不良品だった。
標本での割合は 3/60=1/20。母集団では 1200×1/20=60 個程度と推定できる。
- 国勢調査は全数か標本か
- 視聴率は全数か標本か
- 母集団から無作為に取り出した一部を何という
- 標本の大きさとは
- くじ引きで標本を選ぶ方法を何という
- 学校の身体測定は全数か標本か
- 選挙の出口調査は全数か標本か
- 母集団とは何か
- 標本平均と母平均の関係
- 標本を多くするほど推定の精度はどうなるか
答えを見る
(1) 全数 (2) 標本 (3) 標本 (4) 標本に含まれる個数 (5) 無作為抽出
(6) 全数 (7) 標本 (8) 調査の対象となる集団全体 (9) 標本平均は母平均に近い値
(10) 高くなる
- 袋に赤白合計400個、無作為40個中 赤16個 → 赤の総数推定
- 袋に黒白合計300個、無作為30個中 黒18個 → 黒の総数推定
- 池の魚 200匹に印、別日250匹中印10匹 → 池の魚総数
- 池の魚 80匹印、後日120匹中印8匹 → 総数
- 不良品検査 5000個中無作為100個に不良4個 → 不良総数
- 不良品検査 8000個中無作為200個に不良5個 → 不良総数
- 学校 800人中100人にアンケート、78人がスマホ持つ → 全体推定
- 1000ページ中50ページに誤字3個 → 全体推定
- 大豆を1000粒中50粒に発芽不良2粒 → 全体不良数
- 大量生産10万個から500個調査、不良6個 → 全体推定
答えを見る
(1) 400·16/40 = 160個 (2) 300·18/30 = 180個
(3) (200·250)/10 = 5000匹 (4) (80·120)/8 = 1200匹
(5) 5000·4/100 = 200個 (6) 8000·5/200 = 200個
(7) 800·78/100 = 624人 (8) 1000·3/50 = 60個
(9) 1000·2/50 = 40粒 (10) 100000·6/500 = 1200個
- 世論調査で1000人中750人が賛成。全国民1億2千万人の賛成数
- 箱に同色ボール多数、標本60個中30個赤 → 1000個中赤の数
- 1ページあたり誤字平均1.5個 → 全350ページの推定誤字数
- 大量の電池から100個中不良1個 → 50000個中不良数
- 森の木 200本に番号、後日300本中50本番号付き → 森の木総数
- 選挙の出口調査 1000人中候補A 520人 → 投票総数5万人での得票推定
- テストで100人中合格30人 → 全1000人での合格推定
- 湖の魚 50匹に印、後日100匹中印5匹 → 総数
- 輸入オレンジ 200個中不良6個 → 5000個中不良数
- 調査人数を増やすと推定のばらつきはどう変わるか
答えを見る
(1) 1.2億 × 0.75 = 9000万人 (2) 1000 × 30/60 = 500個
(3) 350 × 1.5 = 525個 (4) 50000 × 1/100 = 500個
(5) (200 × 300) / 50 = 1200本 (6) 50000 × 520/1000 = 26000票
(7) 1000 × 30/100 = 300人 (8) (50·100)/5 = 1000匹
(9) 5000 × 6/200 = 150個 (10) ばらつきが小さくなり、真の値に近い推定になりやすい
テスト前のチェックリスト
- □ 全数調査と標本調査の判別
- □ 無作為抽出の意味(偏りなく選ぶ)
- □ 推定の公式:母集団 = 標本 × 倍率
- □ 捕獲再捕獲法:母数 = (印数 × 再捕獲数) / 再捕獲した印数
- □ 不良品検査・世論調査の典型パターン
- □ 標本が多いほど精度が高い
- 母集団と標本の関係:標本の特徴が母集団にも当てはまる前提
- 無作為抽出の重要性:偏ると推定が外れる
- 計算式:割合(標本中の対象 / 標本数)を母集団に掛ける
- 四捨五入:人数や個数は整数で答える
標本調査の具体的な手順
① 母集団を確認(全体は何個・何人か)
② 標本を無作為に取り出す(標本の大きさを決める)
③ 標本中の比率から母集団を推定
公式:母集団中の対象 = 母集団 × (標本中の対象 / 標本数)
例:500個中、標本20個中3個が不良 → 500 × 3/20 = 75個
捕獲再捕獲法(標識再捕獲法)
N:池の魚の総数(求めたい)
M:最初に印をつけた数
n:後日捕獲した総数
m:後日の中で印つきの数
→ M/N ≒ m/n(比率が等しい)
→ N = M × n / m
例:50匹に印、後日100匹中5匹が印 → N = 50·100/5 = 1000匹
標本調査の身近な例
- テレビ視聴率:全世帯の0.1%程度の世帯を選んで推定
- 世論調査:1000〜2000人で全国民の意見を推定
- 選挙の出口調査:投票直後の数千人で当落を早期予測
- 品質検査:大量生産品の一部を抜き取り検査
- 魚の生息数:捕獲再捕獲法で池・海の魚を推定
- 朝の駅で「電車をよく使うか」と聞く → 通勤者ばかりで偏る
- SNSで意見を集める → ネット利用層に偏る
- 無作為抽出の徹底が標本調査の生命線
- 標本が少なすぎる → 誤差が大きい
- 標本が多すぎる → コストがかかる
- 一般に標本数を 4倍にすると、誤差は 1/2になる
- 標本の大きさを大きくすると、推定値のばらつきは小さくなりやすい
- 標本調査の結果はあくまで 推定値
- 答えは「およそ◯◯個」「約◯◯人」と書く
- 整数で答えるのが基本(小数点以下は四捨五入)