比例之差
( p 1 − p 2 ) ± z a / 2 p 1 ( 1 − p 1 ) n 1 + p 2 ( 1 − p 2 ) n 2 (p_1-p_2)\pm z_{a/2}\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}} (p1−p2)±za/2n1p1(1−p1)+n2p2(1−p2)
例:
在某个电视节目的收视率调查中,从农村随机调查了400人,有32%的人收看了改节目,从城市随机调查了500人,有45%的人收看了该节目。试以95%的置信水平估计城市与农村收视率之差的置信区间。
# p1 = 45%
p1 = 0.45
n1 = 500
# p2 = 32%
p2 = 0.32
n2 = 400
a = 0.05
计算 z a / 2 z_{a/2} za/2
z_a2 = stats.norm.isf(a/2)
计算公式
left = (p1-p2)-z_a2*np.sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
right = (p1-p2)+z_a2*np.sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
print('城市与农村收视率之差的95%的置信区间为({:.2f}%,{:.2f}%)'.format(left*100,right*100))
城市与农村收视率之差的95%的置信区间为(6.68%,19.32%)