匹配大样本
公式:
d ˉ ± z a / 2 σ d n \bar{d}\pm z_{a/2}\frac{\sigma_d}{\sqrt{n}} dˉ±za/2nσd
匹配小样本
公式
d ˉ ± t a / 2 ( n − 1 ) s d n \bar{d}\pm t_{a/2}(n-1)\frac{s_d}{\sqrt{n}} dˉ±ta/2(n−1)nsd
- d ˉ \bar{d} dˉ表示各差值的均值
- σ d \sigma_d σd 表示各差值的标准差
- 当总体的 σ d \sigma_d σd未知时,可用样本差值的标准差 s d s_d sd来代替
例
由10名学生组成一个随机样本,分别采用A和B两套试卷进行测试,结果如下
import pandas as pd
import numpy as np
import scipy as sp
from scipy import stats
data = pd.DataFrame({'A':[78,63,72,89,91,49,68,76,85,55],'B':[71,44,61,84,74,51,55,60,77,39]})
假定两套试卷分数之差,服从正太分布,试建立两套试卷平均分数之差 𝜇𝑑=𝜇1−𝜇2 的95%的置信区间。
# 样本数量
n = len(data)
a = 0.05
# 样本差值的均值
d_bar = (data.A-data.B).mean()
# 差值均值的标准差
sigma_d = (data.A-data.B).std()
计算 t a / 2 t_{a/2} ta/2
t_a2 = stats.t.isf(a/2,n-1)
t_a2
2.262157162740992
计算公式:
left = d_bar-t_a2*(sigma_d/np.sqrt(n))
right = d_bar+t_a2*(sigma_d/np.sqrt(n))
print('两套试卷平均分数之差的95%的置信区间为({:.2f},{:.2f})'.format(left,right))
两套试卷平均分数之差的95%的置信区间为(6.33,15.67)