统计学中一些常见的检验
检验 | 目的 |
---|---|
Z/U检验 | 平均值参数 μ \mu μ的检验 |
单总体T检验 | 一组数据平均值和样本值有无差异 |
独立样本T检验 | 两组数据平均值有无差异 |
配对样本T检验 | 一组样本处理前后平均值有无差异 |
X 2 \mathcal{X}^2 X2检验 | 样本观察频数与理论频数分布是否相一致 |
F检验 | 独立样本的方差的差异显著性检验 |
Z/U检验
特点:大样本,方差已知
单总体均值的检验统计量:
u
=
x
‾
−
μ
0
σ
/
n
u=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}
u=σ/nx−μ0
双正态总体均值的检验统计量:
u
=
x
‾
−
y
‾
σ
1
2
m
+
σ
2
2
n
u=\frac{\overline{x}-\overline{y}}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}}
u=mσ12+nσ22x−y
T检验
整体特点:小样本、方差未知、样本数据服从正态或近似正态分布
T检验属于参数检验,用于检验定量数据(数字有比较意义的),若数据均为定类数据则应使用卡方检验。关于卡方检验的详细介绍可以参考这篇文章。
单个正态总体均值的检验统计量:
t
=
x
‾
−
μ
0
s
/
n
t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}
t=s/nx−μ0
双正态总体均值的检验统计量:
u
=
x
‾
−
y
‾
s
w
1
m
+
1
n
u=\frac{\overline{x}-\overline{y}}{s_w\sqrt{\frac{1}{m}+\frac{1}{n}}}
u=swm1+n1x−y
s
w
2
=
1
m
+
n
−
2
[
∑
i
=
1
m
(
x
i
−
x
‾
)
2
+
∑
i
=
1
n
(
y
i
−
y
‾
)
2
]
s_w^2=\frac{1}{m+n-2}[\sum_{i=1}^m(x_i-\overline{x})^2+\sum_{i=1}^n(y_i-\overline{y})^2]
sw2=m+n−21[i=1∑m(xi−x)2+i=1∑n(yi−y)2]
配对样本T检验
配对样本T检验要求两组样本量相等,而独立样本T检验对样本量没有要求。
t
=
x
‾
−
y
‾
s
w
n
2
t=\frac{\overline{x}-\overline{y}}{s_w\sqrt{\frac{n}{2}}}
t=sw2nx−y
s
w
2
=
(
s
x
2
+
s
y
2
)
/
2
s_w^2=(s_x^2+s_y^2)/2
sw2=(sx2+sy2)/2
独立样本T检验
条件:
- 两样本均来自于正态总体
- 两样本相互独立
- 满足方差齐性(通过方差齐性检验)(F检验)
若未满足方差齐性检验,则需要看T’'检验的结果
F检验
有一个可能混淆的地方:
方差同质性检验即方差齐性检验是——检查不同样本的总体方差是否相同
注意这里的检验并没有对平均值做任何要求,只是满足F检验的前提条件。
在单因素方差分析中使用Levene检验来做方差齐性检验。
Tips:单因素方差分析和独立样本T检验的区别?
一方面,两个类别的时候可以使用T检验,两个或两个类别以上的数据可以使用单因素方差分析。另一方面,独立样本T检验可以不要求样本满足方差齐性的条件,但是单因素分析必须满足方差的同质性检验。
Tips:F检验和卡方检验?
卡方检验在正态总体方差的检验中只能检验单个正态总体,而F检验可以检验双正态分布总体。
单正态总体的方差的检验统计量:
X
2
=
(
n
−
1
)
s
2
σ
0
2
∼
X
2
(
n
−
1
)
\mathcal{X}^2=\frac{(n-1)s^2}{\sigma_0^2}\sim\mathcal{X}^2(n-1)
X2=σ02(n−1)s2∼X2(n−1)
双正态总体的方差的检验统计量:
F
=
s
x
2
s
y
2
∼
F
(
m
−
1
,
n
−
1
)
F=\frac{s_x^2}{s^2_y}\sim{F(m-1,n-1)}
F=sy2sx2∼F(m−1,n−1)
非参数检验
Mann-Whitney U检验
使用情境:独立样本T检验中不满足正态分布性
它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。
单样本Wilcoxon
使用情境:配对样本或单样本T检验不满足正态分布性
Kruskal-Wallis 单因子变异数分析
使用情境:当数据不满足单因素方差分析的条件时(严重偏态)