总体比例
公式:
p ± z a / 2 p ( 1 − p ) n p \pm z_{a/2} \sqrt{\frac{p(1-p)}{n}} p±za/2np(1−p)
例:
某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女职工,试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。
import pandas as pd
import numpy as np
import scipy as sp
from scipy import stats
# 样本量 n=100
n = 100
# 比例 p
p = 65/100
a = 0.05
计算 z a / 2 z_{a/2} za/2
z_a2 = stats.norm.isf(a/2)
计算公式:
left = p - z_a2*np.sqrt(p*(1-p)/n)
right = p + z_a2*np.sqrt(p*(1-p)/n)
left,right
(0.5565156760890944, 0.7434843239109057)
print('该城市下岗职工中女性比例的95%的置信区间为({:.2f}%,{:.2f}%)'.format(left*100,right*100))
该城市下岗职工中女性比例的95%的置信区间为(55.65%,74.35%)