Z检验和t检验

Z检验

Z检验(Z Test)是一种统计学中的假设检验方法,主要用于在大样本情况下(通常样本容量大于30)评估样本平均数与已知总体平均数之间是否存在显著差异,或者比较两个独立大样本的平均数是否存在显著差异
这种检验基于这样的前提:样本数据来自于一个正态分布的总体,并且总体的标准差是已知的或者是可以根据样本数据合理估计的。

Z检验的核心在于计算一个统计量Z值,这个Z值表示了观察到的样本均值与假设的总体均值之间的偏离程度,以标准差为单位。计算公式如下:

Z = X ˉ − μ 0 ( σ / n ) Z = \frac{\bar{X} - \mu_0}{(\sigma/\sqrt{n})} Z=(σ/n )Xˉμ0

其中:

  • X ˉ 是样本平均数 \bar{X} 是样本平均数 Xˉ是样本平均数
  • μ 0 是假设的总体平均数 \mu_0 是假设的总体平均数 μ0是假设的总体平均数
  • σ 是总体标准差 \sigma 是总体标准差 σ是总体标准差
  • n 是样本容量 n 是样本容量 n是样本容量

计算得到的Z值随后会被与标准正态分布表进行比较,以确定这个差异发生的概率(P值),进而决定是否拒绝原假设(通常是认为两者的均值没有差异)。
如果P值小于事先设定的显著性水平(如0.05),那么就认为样本数据支持拒绝原假设,即样本均值与总体均值或两个样本的平均数之间存在显著差异。

例子

数据集

首先,我们假设超市收集到的30块巧克力的重量数据如下(单位:克):

巧克力编号重量
198
2102
397
29101
30103

为了简化,我将直接给出这些数据的统计摘要,而不是列出所有数据点:

  • 样本平均重量 ( x ˉ ) = 99.5 克 样本平均重量 (\bar{x}) = 99.5克 样本平均重量(xˉ)=99.5
  • 样本标准差 (s) = 1.2克
  • 样本大小 (n) = 30

Z检验步骤

步骤1: 确定零假设和备择假设

零假设 H 0 : μ = 100 克(即巧克力的平均重量为 100 克) 零假设H_0: \mu = 100 克(即巧克力的平均重量为100克) 零假设H0:μ=100克(即巧克力的平均重量为100克)
备择假设 H 1 : μ ≠ 100 克(即巧克力的平均重量不等于 100 克,这是一个双侧检验) 备择假设H_1: \mu \neq 100克(即巧克力的平均重量不等于100克,这是一个双侧检验) 备择假设H1:μ=100克(即巧克力的平均重量不等于100克,这是一个双侧检验)

步骤2: 计算Z统计量

Z = x ˉ − μ 0 σ / n Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} Z=σ/n xˉμ0

这里, μ 0 = 100 克是假设的总体均值, σ 是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差 s 作为估计,并且由于生产过程控制较好,假设 σ 已知或接近 s ,这里直接用 s 代替。 这里,\mu_0 = 100 克是假设的总体均值,\sigma是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差 s作为估计,并且由于生产过程控制较好,假设 \sigma已知或接近 s,这里直接用 s 代替。 这里,μ0=100克是假设的总体均值,σ是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差s作为估计,并且由于生产过程控制较好,假设σ已知或接近s,这里直接用s代替。
因此

Z = 99.5 − 100 1.2 / 30 ≈ − 0.5 0.1732 ≈ − 2.88 Z = \frac{99.5 - 100}{1.2 / \sqrt{30}} \approx \frac{-0.5}{0.1732} \approx -2.88 Z=1.2/30 99.51000.17320.52.88

步骤3: 查Z表确定P值

接下来,我们需要查找标准正态分布表或使用统计软件/计算器找到Z值为-2.88时对应的累积概率,从而得到右侧尾部的概率,因为是双侧检验,所以P值应该是两侧之和的一半。

从标准正态分布表中查得,对于Z=-2.88,右侧尾部的概率约为0.0019。因此,双侧P值为 2 × 0.0019 = 0.0038 2 \times 0.0019 = 0.0038 2×0.0019=0.0038

步骤4: 做出决策

一般而言,如果P值小于显著性水平(例如0.05),我们将拒绝零假设。在这个例子中,P值=0.0038远小于0.05,所以我们有足够的证据拒绝零假设。

结论

基于这个Z检验,我们可以得出结论,超市收集到的巧克力样本平均重量与厂家声称的100克存在显著差异(P < 0.05)。这意味着根据样本数据,我们有理由相信这种巧克力的平均重量不等于100克。

t检验

t检验,又称为Student’s t检验,是一种在统计学中广泛使用的假设检验方法,主要用来判断两组数据的平均值(均值)是否存在显著性差异。
它适用于样本数量相对较小(通常n<30,尽管这个界限不是绝对的),并且总体标准差未知的情况。t检验基于t分布,这是一种在小样本情况下对正态分布数据进行推断的连续概率分布。

1. 单样本t检验

前提条件:数据应近似正态分布

零假设(H0):样本均值μ等于一个已知的总体均值μ₀。

公式 t = x ˉ − μ 0 ( s n ) t = \frac{\bar{x} - \mu_0}{\left( \frac{s}{\sqrt{n}} \right)} t=(n s)xˉμ0

  • x ˉ 是样本均值 \bar{x} 是样本均值 xˉ是样本均值
  • μ 0 是假设的总体均值 \mu_0 是假设的总体均值 μ0是假设的总体均值
  • s 是样本标准偏差 s 是样本标准偏差 s是样本标准偏差
  • n 是样本容量 n 是样本容量 n是样本容量

决策:将计算出的t值与t分布表中的临界值比较,或者计算p值,如果p值小于显著性水平(如α=0.05),则拒绝H0,认为样本均值与总体均值之间存在显著差异。

2. 独立样本t检验(两样本t检验)

前提条件:两组数据独立且各自来自正态分布的总体,且两组的方差相等(同方差性)或不等(异方差性)。

零假设(H0):两组样本的总体均值相等(μ₁ = μ₂)。

公式:取决于是否满足方差齐性。

  • 方差相等时( pooled variance ):
    t = ( x ˉ 1 − x ˉ 2 ) − ( μ 1 − μ 2 ) ( s 1 2 n 1 + s 2 2 n 2 ) t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\left(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2}\right)}} t=(n1s12+n2s22) (xˉ1xˉ2)(μ1μ2)

    其中, x ˉ 1 , x ˉ 2 分别为两组样本均值, s 1 2 , s 2 2 分别为两组样本方差, n 1 , n 2 分别为两组样本容量。 其中,\bar{x}_1, \bar{x}_2 分别为两组样本均值,s^2_1, s^2_2 分别为两组样本方差,n_1, n_2分别为两组样本容量。 其中,xˉ1,xˉ2分别为两组样本均值,s12,s22分别为两组样本方差,n1,n2分别为两组样本容量。

  • 方差不等时(Welch’s t-test):
    公式较为复杂,通常直接使用统计软件计算。

决策:同样通过比较t值与临界值或计算得到的p值来决定是否拒绝零假设。

3. 配对样本t检验

前提条件:配对数据需满足正态分布,且差值也应近似正态分布

零假设(H0):配对样本的总体均差为零(即处理前后的差异不显著)。

公式
t = d ˉ − δ ( s d n ) t = \frac{\bar{d} - \delta}{\left( \frac{s_d}{\sqrt{n}} \right)} t=(n sd)dˉδ

  • d ˉ 是差值的样本均值 \bar{d} 是差值的样本均值 dˉ是差值的样本均值
  • δ 是零假设下的总体均差(通常设为 0 ) \delta 是零假设下的总体均差(通常设为0) δ是零假设下的总体均差(通常设为0
  • s d 是差值的样本标准差 s_d 是差值的样本标准差 sd是差值的样本标准差
  • n 是配对数(每对数据视为一次观测) n 是配对数(每对数据视为一次观测) n是配对数(每对数据视为一次观测)

决策:与上述相同,依据t值或p值决定是否拒绝H0。

例子

为了便于理解,我们将使用假定的数据集,并假设我们正在使用α=0.05作为显著性水平。

1. 单样本t检验示例

问题:研究者想知道某工厂生产的一批产品的平均重量是否与规定的250克一致。 抽取了 n = 15 个产品的样本,得到的平均重量为 x ˉ = 248 克,样本标准差为 s = 3 克。 抽取了n=15个产品的样本,得到的平均重量为\bar{x}=248克,样本标准差为s=3克。 抽取了n=15个产品的样本,得到的平均重量为xˉ=248克,样本标准差为s=3克。

步骤

  1. 提出假设

    • H 0 : μ = 250 克 H0: \mu = 250 克 H0:μ=250
    • H 1 : μ ≠ 250 克 H1: \mu \neq 250克 H1:μ=250
  2. 计算t统计量
    t = x ˉ − μ 0 ( s n ) = 248 − 250 ( 3 15 ) ≈ − 1.633 t = \frac{\bar{x} - \mu_0}{\left( \frac{s}{\sqrt{n}} \right)} = \frac{248 - 250}{\left( \frac{3}{\sqrt{15}} \right)} \approx -1.633 t=(n s)xˉμ0=(15 3)2482501.633

  3. 查表或计算p值:使用t分布表或统计软件,找到自由度(df=n-1=14),对应双侧检验的t值约为-1.761(对于α=0.05)。

  4. 决策:因为|t|=|-1.633| < |-1.761|,我们不能拒绝H0,意味着没有足够证据表明这批产品的平均重量与250克有显著差异。

2. 独立样本t检验示例(假设方差相等)

问题:比较两种教学方法对学生考试成绩的影响。
方法A的样本(n1=20)平均分是85,标准差是5;
方法B的样本(n2=25)平均分是80,标准差也是5。

步骤

  1. 提出假设

    • H 0 : μ 1 = μ 2 (两组平均分无差异) H0: \mu_1 = \mu_2(两组平均分无差异) H0:μ1=μ2(两组平均分无差异)
    • H 1 : μ 1 ≠ μ 2 H1: \mu_1 \neq \mu_2 H1:μ1=μ2
  2. 计算t统计量
    t = ( x ˉ 1 − x ˉ 2 ) − 0 ( s 1 2 n 1 + s 2 2 n 2 ) = ( 85 − 80 ) ( 5 2 20 + 5 2 25 ) ≈ 2.92 t = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\left(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2}\right)}} = \frac{(85-80)}{\sqrt{\left(\frac{5^2}{20} + \frac{5^2}{25}\right)}} \approx 2.92 t=(n1s12+n2s22) (xˉ1xˉ2)0=(2052+2552) (8580)2.92

  3. 查表或计算p值:自由度为n1+n2-2=43,查t分布表或用软件得到对应双侧检验的临界值约为±2.015(α=0.05)。

  4. 决策:因为|t|=2.92 > 2.015,我们拒绝H0,认为两种教学方法对学生成绩的影响有显著差异。

3. 配对样本t检验示例

问题:研究一种新药的效果,测量了10名患者治疗前后的血压变化。治疗前平均血压为140mmHg,治疗后为130mmHg,差值的样本标准差为4mmHg。

步骤

  1. 提出假设

    • H 0 : 差值的总体均值 δ = 0 (治疗前后血压无变化) H0: 差值的总体均值\delta = 0(治疗前后血压无变化) H0:差值的总体均值δ=0(治疗前后血压无变化)
    • H 1 : δ ≠ 0 H1: \delta \neq 0 H1:δ=0
  2. 计算t统计量
    t = d ˉ − δ ( s d n ) = ( 140 − 130 ) ( 4 10 ) = 7.07 t = \frac{\bar{d} - \delta}{\left( \frac{s_d}{\sqrt{n}} \right)} = \frac{(140-130)}{\left( \frac{4}{\sqrt{10}} \right)} = 7.07 t=(n sd)dˉδ=(10 4)(140130)=7.07

  3. 查表或计算p值:自由度为n-1=9,查表或计算得到对应的双侧检验临界值远小于7.07。

  4. 决策:因为t值非常大,相应的p值会极小,远远小于α=0.05,我们强烈拒绝H0,表明治疗确实引起了血压的显著下降。

请注意,这些例子中的计算简化了许多细节,实际应用中应使用精确数值进行计算,并考虑数据是否满足t检验的前提条件。

  • 13
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不易撞的网名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值