統計学・視聴率調査などの標本数の決め方
視聴率調査のように見る・見ない、あるいは世論調査における賛成する・しない、のように二者択一的な設問に関する比率(視聴率、賛成者の割合)について考えることにしよう。
この調査の誤差(標本平均と母集団の平均の差)が許容範囲dポイント*1を超えない確率を(1-α)(例えば95%)以上にするために必要な標本数を求めることにする。
別の言い方をすれば、確率(1-α)で誤差をdポイント以下にする。すなわち、
・・・(1)
を満たす標本数を計算する。ただし、は標本平均、は母集団の平均である。
今回のように二者択一的な設問の場合には、母分散σ 2は母集団の見る(賛成する)確率をpとしてσ 2=p(1-p)で計算することができる*2。例えば視聴率が20%の場合はp=0.2なのでσ 2=0.2*0.8=0.16となる。ただし、事前にpの値が分かることは少ないため、最も分散が大きくなるp=1/2、すなわちσ 2=1/4を仮定することも多い。
この時、必要な標本数は次のように与えられる。
・・・(2)
この式における1.96は標準正規分布の95%点から導出される。
特にσ 2=1/4を仮定する場合には、
より簡略化して述べれば次のようになる。
視聴率や賛成者の割合などの調査で、誤差がdポイント以下になる確率を95%以上にしたい場合、最小限必要な標本数はおよそ次の式で求められる。
参考にまで計算すると次の通り。
誤差(ポイント) | 必要標本数 |
---|---|
0.5 | 40,000 |
1 | 10,000 |
2 | 2,500 |
3 | 1,111 |
4 | 625 |
5 | 400 |