文章目录
Z检验
Z检验(Z Test)是一种统计学中的假设检验方法,主要用于在大样本
情况下(通常样本容量大于30)评估样本平均数与已知总体平均数之间是否存在显著差异,或者比较两个独立大样本的平均数是否存在显著差异
。
这种检验基于这样的前提:样本数据来自于一个正态分布
的总体,并且总体的标准差是已知
的或者是可以根据样本数据合理估计
的。
Z检验的核心
在于计算一个统计量Z值,这个Z值表示了观察到的样本均值与假设的总体均值之间的偏离程度
,以标准差为单位。计算公式如下:
Z = X ˉ − μ 0 ( σ / n ) Z = \frac{\bar{X} - \mu_0}{(\sigma/\sqrt{n})} Z=(σ/n)Xˉ−μ0
其中:
- X ˉ 是样本平均数 \bar{X} 是样本平均数 Xˉ是样本平均数
- μ 0 是假设的总体平均数 \mu_0 是假设的总体平均数 μ0是假设的总体平均数
- σ 是总体标准差 \sigma 是总体标准差 σ是总体标准差
- n 是样本容量 n 是样本容量 n是样本容量
计算得到的Z值随后会被与标准正态分布表进行比较,以确定这个差异发生的概率(P值),进而决定是否拒绝原假设(通常是认为两者的均值没有差异)。
如果P值小于
事先设定的显著性水平(如0.05),那么就认为样本数据支持拒绝原假设,即样本均值与总体均值或两个样本的平均数之间存在显著差异。
例子
数据集
首先,我们假设超市收集到的30块巧克力的重量数据如下(单位:克):
巧克力编号 | 重量 |
---|---|
1 | 98 |
2 | 102 |
3 | 97 |
… | … |
29 | 101 |
30 | 103 |
为了简化,我将直接给出这些数据的统计摘要,而不是列出所有数据点:
- 样本平均重量 ( x ˉ ) = 99.5 克 样本平均重量 (\bar{x}) = 99.5克 样本平均重量(xˉ)=99.5克
- 样本标准差 (s) = 1.2克
- 样本大小 (n) = 30
Z检验步骤
步骤1: 确定零假设和备择假设
零假设
H
0
:
μ
=
100
克(即巧克力的平均重量为
100
克)
零假设H_0: \mu = 100 克(即巧克力的平均重量为100克)
零假设H0:μ=100克(即巧克力的平均重量为100克)
备择假设
H
1
:
μ
≠
100
克(即巧克力的平均重量不等于
100
克,这是一个双侧检验)
备择假设H_1: \mu \neq 100克(即巧克力的平均重量不等于100克,这是一个双侧检验)
备择假设H1:μ=100克(即巧克力的平均重量不等于100克,这是一个双侧检验)
步骤2: 计算Z统计量
Z = x ˉ − μ 0 σ / n Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} Z=σ/nxˉ−μ0
这里,
μ
0
=
100
克是假设的总体均值,
σ
是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差
s
作为估计,并且由于生产过程控制较好,假设
σ
已知或接近
s
,这里直接用
s
代替。
这里,\mu_0 = 100 克是假设的总体均值,\sigma是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差 s作为估计,并且由于生产过程控制较好,假设 \sigma已知或接近 s,这里直接用 s 代替。
这里,μ0=100克是假设的总体均值,σ是总体标准差,但由于通常未知,且样本量较大,我们可以使用样本标准差s作为估计,并且由于生产过程控制较好,假设σ已知或接近s,这里直接用s代替。
因此
Z = 99.5 − 100 1.2 / 30 ≈ − 0.5 0.1732 ≈ − 2.88 Z = \frac{99.5 - 100}{1.2 / \sqrt{30}} \approx \frac{-0.5}{0.1732} \approx -2.88 Z=1.2/3099.5−100≈0.1732−0.5≈−2.88
步骤3: 查Z表确定P值
接下来,我们需要查找标准正态分布表或使用统计软件/计算器找到Z值为-2.88时对应的累积概率,从而得到右侧尾部的概率,因为是双侧检验,所以P值应该是两侧之和的一半。
从标准正态分布表中查得,对于Z=-2.88,右侧尾部的概率约为0.0019。因此,双侧P值为 2 × 0.0019 = 0.0038 2 \times 0.0019 = 0.0038 2×0.0019=0.0038
步骤4: 做出决策
一般而言,如果P值小于显著性水平(例如0.05),我们将拒绝零假设。在这个例子中,P值=0.0038远小于0.05,所以我们有足够的证据拒绝零假设。
结论
基于这个Z检验,我们可以得出结论,超市收集到的巧克力样本平均重量与厂家声称的100克存在显著差异(P < 0.05)。这意味着根据样本数据,我们有理由相信这种巧克力的平均重量不等于100克。
t检验
t检验,又称为Student’s t检验,是一种在统计学中广泛使用的假设检验方法,主要用来判断两组数据的平均值(均值)
是否存在显著性差异。
它适用于样本数量相对较小
(通常n<30,尽管这个界限不是绝对的),并且总体标准差未知
的情况。t检验基于t分布,这是一种在小样本情况下对正态分布数据进行推断的连续概率分布。
1. 单样本t检验
前提条件:数据应近似正态分布
。
零假设(H0):样本均值μ等于一个已知的总体
均值μ₀。
公式: t = x ˉ − μ 0 ( s n ) t = \frac{\bar{x} - \mu_0}{\left( \frac{s}{\sqrt{n}} \right)} t=(ns)xˉ−μ0
- x ˉ 是样本均值 \bar{x} 是样本均值 xˉ是样本均值
- μ 0 是假设的总体均值 \mu_0 是假设的总体均值 μ0是假设的总体均值
- s 是样本标准偏差 s 是样本标准偏差 s是样本标准偏差
- n 是样本容量 n 是样本容量 n是样本容量
决策:将计算出的t值与t分布表中的临界值比较,或者计算p值,如果p值小于显著性水平(如α=0.05),则拒绝H0,认为样本均值与总体均值之间存在显著差异。
2. 独立样本t检验(两样本t检验)
前提条件:两组数据独立
且各自来自正态
分布的总体,且两组的方差相等(同方差性)或不等(异方差性)。
零假设(H0):两组样本的总体均值相等(μ₁ = μ₂)。
公式:取决于是否满足方差齐性。
-
方差相等时( pooled variance ):
t = ( x ˉ 1 − x ˉ 2 ) − ( μ 1 − μ 2 ) ( s 1 2 n 1 + s 2 2 n 2 ) t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{\sqrt{\left(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2}\right)}} t=(n1s12+n2s22)(xˉ1−xˉ2)−(μ1−μ2)其中, x ˉ 1 , x ˉ 2 分别为两组样本均值, s 1 2 , s 2 2 分别为两组样本方差, n 1 , n 2 分别为两组样本容量。 其中,\bar{x}_1, \bar{x}_2 分别为两组样本均值,s^2_1, s^2_2 分别为两组样本方差,n_1, n_2分别为两组样本容量。 其中,xˉ1,xˉ2分别为两组样本均值,s12,s22分别为两组样本方差,n1,n2分别为两组样本容量。
-
方差不等时(Welch’s t-test):
公式较为复杂,通常直接使用统计软件计算。
决策:同样通过比较t值与临界值或计算得到的p值来决定是否拒绝零假设。
3. 配对样本t检验
前提条件:配对数据需满足正态
分布,且差值也应近似正态分布
。
零假设(H0):配对样本的总体均差为零
(即处理前后的差异不显著)。
公式:
t
=
d
ˉ
−
δ
(
s
d
n
)
t = \frac{\bar{d} - \delta}{\left( \frac{s_d}{\sqrt{n}} \right)}
t=(nsd)dˉ−δ
- d ˉ 是差值的样本均值 \bar{d} 是差值的样本均值 dˉ是差值的样本均值
- δ 是零假设下的总体均差(通常设为 0 ) \delta 是零假设下的总体均差(通常设为0) δ是零假设下的总体均差(通常设为0)
- s d 是差值的样本标准差 s_d 是差值的样本标准差 sd是差值的样本标准差
- n 是配对数(每对数据视为一次观测) n 是配对数(每对数据视为一次观测) n是配对数(每对数据视为一次观测)
决策:与上述相同,依据t值或p值决定是否拒绝H0。
例子
为了便于理解,我们将使用假定的数据集,并假设我们正在使用α=0.05作为显著性水平。
1. 单样本t检验示例
问题:研究者想知道某工厂生产的一批产品的平均重量是否与规定的250克一致。 抽取了 n = 15 个产品的样本,得到的平均重量为 x ˉ = 248 克,样本标准差为 s = 3 克。 抽取了n=15个产品的样本,得到的平均重量为\bar{x}=248克,样本标准差为s=3克。 抽取了n=15个产品的样本,得到的平均重量为xˉ=248克,样本标准差为s=3克。
步骤:
-
提出假设:
- H 0 : μ = 250 克 H0: \mu = 250 克 H0:μ=250克
- H 1 : μ ≠ 250 克 H1: \mu \neq 250克 H1:μ=250克
-
计算t统计量:
t = x ˉ − μ 0 ( s n ) = 248 − 250 ( 3 15 ) ≈ − 1.633 t = \frac{\bar{x} - \mu_0}{\left( \frac{s}{\sqrt{n}} \right)} = \frac{248 - 250}{\left( \frac{3}{\sqrt{15}} \right)} \approx -1.633 t=(ns)xˉ−μ0=(153)248−250≈−1.633 -
查表或计算p值:使用t分布表或统计软件,找到自由度(df=n-1=14),对应双侧检验的t值约为-1.761(对于α=0.05)。
-
决策:因为|t|=|-1.633| < |-1.761|,我们不能拒绝H0,意味着没有足够证据表明这批产品的平均重量与250克有显著差异。
2. 独立样本t检验示例(假设方差相等)
问题:比较两种教学方法对学生考试成绩的影响。
方法A的样本(n1=20)平均分是85,标准差是5;
方法B的样本(n2=25)平均分是80,标准差也是5。
步骤:
-
提出假设:
- H 0 : μ 1 = μ 2 (两组平均分无差异) H0: \mu_1 = \mu_2(两组平均分无差异) H0:μ1=μ2(两组平均分无差异)
- H 1 : μ 1 ≠ μ 2 H1: \mu_1 \neq \mu_2 H1:μ1=μ2
-
计算t统计量:
t = ( x ˉ 1 − x ˉ 2 ) − 0 ( s 1 2 n 1 + s 2 2 n 2 ) = ( 85 − 80 ) ( 5 2 20 + 5 2 25 ) ≈ 2.92 t = \frac{(\bar{x}_1 - \bar{x}_2) - 0}{\sqrt{\left(\frac{s^2_1}{n_1} + \frac{s^2_2}{n_2}\right)}} = \frac{(85-80)}{\sqrt{\left(\frac{5^2}{20} + \frac{5^2}{25}\right)}} \approx 2.92 t=(n1s12+n2s22)(xˉ1−xˉ2)−0=(2052+2552)(85−80)≈2.92 -
查表或计算p值:自由度为n1+n2-2=43,查t分布表或用软件得到对应双侧检验的临界值约为±2.015(α=0.05)。
-
决策:因为|t|=2.92 > 2.015,我们拒绝H0,认为两种教学方法对学生成绩的影响有显著差异。
3. 配对样本t检验示例
问题:研究一种新药的效果,测量了10名患者治疗前后的血压变化。治疗前平均血压为140mmHg,治疗后为130mmHg,差值的样本标准差为4mmHg。
步骤:
-
提出假设:
- H 0 : 差值的总体均值 δ = 0 (治疗前后血压无变化) H0: 差值的总体均值\delta = 0(治疗前后血压无变化) H0:差值的总体均值δ=0(治疗前后血压无变化)
- H 1 : δ ≠ 0 H1: \delta \neq 0 H1:δ=0
-
计算t统计量:
t = d ˉ − δ ( s d n ) = ( 140 − 130 ) ( 4 10 ) = 7.07 t = \frac{\bar{d} - \delta}{\left( \frac{s_d}{\sqrt{n}} \right)} = \frac{(140-130)}{\left( \frac{4}{\sqrt{10}} \right)} = 7.07 t=(nsd)dˉ−δ=(104)(140−130)=7.07 -
查表或计算p值:自由度为n-1=9,查表或计算得到对应的双侧检验临界值远小于7.07。
-
决策:因为t值非常大,相应的p值会极小,远远小于α=0.05,我们强烈拒绝H0,表明治疗确实引起了血压的显著下降。
请注意
,这些例子中的计算简化了许多细节,实际应用中应使用精确数值进行计算,并考虑数据是否满足t检验的前提条件。