总体比例
n = ( z a / 2 ) 2 ∙ π ( 1 − π ) E 2 n=\frac{(z_{a/2})^2\bullet \pi(1-\pi)}{E^2} n=E2(za/2)2∙π(1−π) , E = Δ E = \Delta E=Δ
-
如果能够求出 π \pi π的值,就可以用上面的公式计算所需的样本量。
-
如果 π \pi π的值不知道,可以用类似的样本比例来代替。
-
当 π \pi π的值无法知道时,通常取 π ( 1 − π ) = 0.25 \pi(1-\pi)=0.25 π(1−π)=0.25的最大值, π \pi π=0.5
例:
根据以往的生产统计,某种产品的合格率约为90%,现要求估计误差为5%,在95%的置信区间下,应抽取多少个产品最为样本?
import pandas as pd
import numpy as np
import math
from scipy import stats
# 95%的置信区间
a = 0.05
# pi=90%
pi = 0.9
# 希望达到的估计误差,E=5%
E = 0.05
计算 z a / 2 z_{a/2} za/2
z_a2 = stats.norm.isf(a/2)
z_a2
1.9599639845400545
计算公式
n = (np.power(z_a2,2)*pi*(1-pi))/np.power(E,2)
n
138.29251754498853
# 样本量向上取整 n 取 139
n = math.ceil(n)
print('应抽取{}个产品作为样本'.format(n))
应抽取139个产品作为样本