t检验(student t检验)是应用t分布的特征,将t作为检验的统计量来进行统计推断方法。它对样本要求较小(例如n<30)。
主要用途:
- 样本均数与总体均数的差异比较
- 两样本均数的差异比较
分类:
- 单样本t检验
- 独立样本t检验
- 配对样本t检验
单样本t检验
单样本t检验主要用于判断样本均数与总体均数是否存在显著差异。
适用条件
- 已知一个总体均数
- 已知一个样本均数及该样本标准差
- 样本正态分布或近似正态总体
实际应用中,当数据量足够大时,对样本正态分布要求不再严格。只要数据分布不是严重偏态,一般来说单样本t检验都是适用的。
具体计算公式
t = x ˉ − μ 0 s / n t=\frac{\bar{x}-μ_0}{s/\sqrt{n}} t=s/nxˉ−μ0
自 由 度 d f = n − 1 自由度df=n-1 自由度df=n−1
其中, x ˉ \bar{x} xˉ为样本均数、 μ 0 \mu_0 μ0为总体均数, s s s为样本标准偏差、 n n n为样本数。该统计量t在原假设 μ = μ 0 \mu=\mu_0 μ=μ0为真的条件下服从自由度为 n − 1 n-1 n−1的t分布。
R语言示例
R语言中可以用t.test函数进行t检验
(虚构)从某小学六年级抽取10名学生,其身高(单位:cm),是否认为该学校六年级平均身高130cm?
10名学生身高:
130,120,130,110,130,135,129,124,130,134
#生成数据
x <- c(130,120,130,110,130,135,129,124,130,134)
#t检验
t.test(x,mu = 130)
One Sample t-test
data: x
t = -1.1884, df = 9, p-value =
0.2651
alternative hypothesis: true mean is not equal to 130
95 percent confidence interval:
121.8702 132.5298
sample estimates:
mean of x
127.2
#结果显示,P=0.2651>0.05。在统计学上说明样本均数与总体均数没有差别。
独立样本t检验
独立样本t检验主要检验两个样本均数及其所代表的总体之间差异是否显著。
适用条件
- 独立性,各观察值之间相关独立
- 正态性,各样本均来自正态分布的总体
- 方差齐性,各样本所在总体的方差相等
具体计算公式
- 方差齐性条件下下
s c 2 = s 1 2 ( n 1 − 1 ) + s 2 2 ( n 2 − 1 ) n 1 + n 2 − 2 s_c^2=\frac{s_1^2(n_1-1)+s_2^2(n_2-1)}{n_1+n_2-2} sc2=n1+n2−2