Python统计分析-独立样本t检验

2 篇文章 2 订阅
2 篇文章 0 订阅

单个正态总体参数的显著性检验, 它是把样本统计量的观察值与原假设所提供的总体参数作比较, 这种检验要求我们事先能提出合理的参数假设值, 并对参数有某种意义的备择值, 但在实际工作中很难做到这一点, 因而限制了这种方法在实际中的应用.实际中常常选择两个样本, 一个作为处理,一个作为对照, 在两个样本之间作比较. 比如, 要比较某班男生的成绩是否比女生的高, 服用某种维生素的人是否比不服用的人不易感冒, 或判断它们之间是否存在明显显著的差异, 等等。

设总体X与Y独立,XN($\mu_1,\sigma_1^{2}$),YN( μ 2 , σ 2 2 \mu_2,\sigma_2^{2} μ2,σ22)。 X 1 X_{1} X1, X 2 X_{2} X2, X 3 X_{3} X3,…, X n 1 X_{n1} Xn1是来自总体X的样本, X ˉ \bar{X} Xˉ为其样本均值, S 1 2 S_1^{2} S12为其样本方差。 Y 1 Y_{1} Y1, Y 2 Y_{2} Y2, Y 3 Y_{3} Y3,…, Y n 2 Y_{n2} Yn2是来自总体Y的样本, Y ˉ \bar{Y} Yˉ为其样本均值, S 2 2 S_2^{2} S22为其样本方差。

设两正态总体的方差相等,即 σ 1 2 \sigma_1^{2} σ12= σ 2 2 \sigma_2^{2} σ22= σ 2 \sigma^2 σ2

(1) H 0 : μ 1 = μ 2 &lt; − − − &gt; H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2 &lt;---&gt; H_1:\mu_1\neq\mu_2 H0:μ1=μ2<>H1:μ1̸=μ2 (双边假设检验)

(2) H 0 : μ 1 ≤ μ 2 &lt; − − − &gt; H 1 : μ 1 &gt; μ 2 H_0:\mu_1\leq\mu_2 &lt;---&gt; H_1:\mu_1&gt;\mu_2 H0:μ1μ2<>H1:μ1>μ2 (单边假设检验)

(3) H 0 : μ 1 ≥ μ 2 &lt; − − − &gt; H 1 : μ 1 &lt; μ 2 H_0:\mu_1\geq\mu_2 &lt;---&gt; H_1:\mu_1&lt;\mu_2 H0:μ1μ2<>H1:μ1<μ2 (单边假设检验)

这时在 H 0 : μ 1 = μ 2 H_0:\mu_1=\mu_2 H0:μ1=μ2下可得:
T = ( x ˉ − y ˉ ) − ( μ 1 − μ 2 ) ( 1 n 1 + 1 n 2 ) s 2 T=\frac{(\bar{x}-\bar{y})-(\mu_1-\mu_2)}{\sqrt{(\frac{1}{n_1}+\frac{1}{n_2})}s^2} T=(n11+n21) s2(xˉyˉ)(μ1μ2) ~ t ( n 1 + n 2 − 2 ) t(n_1+n_2-2) t(n1+n22)

例:甲、乙两台机床分别加工某种轴承, 轴承的直径分别服从正态分布N( μ 1 , σ 1 2 \mu_1,\sigma_1^{2} μ1,σ12)和N( μ 2 , σ 2 2 \mu_2,\sigma_2^{2} μ2,σ22), 从各自加工的轴承中分别抽取若干个轴承测其直径。

μ 1 = μ 2 \mu_1=\mu_2 μ1=μ2问两台机床的加工精度有无显著差异?(取α=0.05)

总体样本容量直径
X(机床甲)820.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9
Y(机床乙)720.7, 19.8, 19.5, 20.8, 20.4, 19.6, 20.2
from  scipy.stats import ttest_ind, levene
import pandas as pd

x = [20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9]
y = [20.7, 19.8, 19.5, 20.8, 20.4, 19.6, 20.2]
# 方差齐性检验
print(levene(x,y))

# 独立样本T检验,默认方差齐性
print(ttest_ind(x, y))
# 如果方差不齐性,则equal_var=False
print(ttest_ind(x,y,equal_var=False))
print(levene(x,y))
# LeveneResult(statistic=0.49616519174040724, pvalue=0.49361609677338825)
# 检验结果为p>0.05所以,可以认为方差是相等的。
print(ttest_ind(x, y))
# Ttest_indResult(statistic=-0.8548480353442837, pvalue=0.40811369790462515)
#  因为p值=0.4081>0.05, 故接受原假设, 认为两台机床的加工精度无显著差异。 
  • 7
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值