python两个总体参数的区间估计(均值之差,匹配样本)

匹配大样本

公式:

d ˉ ± z a / 2 σ d n \bar{d}\pm z_{a/2}\frac{\sigma_d}{\sqrt{n}} dˉ±za/2n σd

匹配小样本

公式

d ˉ ± t a / 2 ( n − 1 ) s d n \bar{d}\pm t_{a/2}(n-1)\frac{s_d}{\sqrt{n}} dˉ±ta/2(n1)n sd

  • d ˉ \bar{d} dˉ表示各差值的均值
  • σ d \sigma_d σd 表示各差值的标准差
  • 当总体的 σ d \sigma_d σd未知时,可用样本差值的标准差 s d s_d sd来代替

由10名学生组成一个随机样本,分别采用A和B两套试卷进行测试,结果如下

import pandas as pd
import numpy as np
import scipy as sp
from scipy import stats

data = pd.DataFrame({'A':[78,63,72,89,91,49,68,76,85,55],'B':[71,44,61,84,74,51,55,60,77,39]})

假定两套试卷分数之差,服从正太分布,试建立两套试卷平均分数之差 𝜇𝑑=𝜇1−𝜇2 的95%的置信区间。

# 样本数量
n = len(data)

a = 0.05
# 样本差值的均值
d_bar = (data.A-data.B).mean()
# 差值均值的标准差
sigma_d = (data.A-data.B).std()

计算 t a / 2 t_{a/2} ta/2

t_a2 = stats.t.isf(a/2,n-1)
t_a2

2.262157162740992

计算公式:

left = d_bar-t_a2*(sigma_d/np.sqrt(n))
right = d_bar+t_a2*(sigma_d/np.sqrt(n))
print('两套试卷平均分数之差的95%的置信区间为({:.2f},{:.2f})'.format(left,right))

两套试卷平均分数之差的95%的置信区间为(6.33,15.67)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

M冰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值