Student’s t-test
常作为检验一组来自正态分布总体的独立样本的期望值是否为一个实数,或者两组正态分布样本的期望值之差是否为某一个实数。可以用于检验两个样本集是否有显著的差异。
前提假设
大多数的 t − t e s t t-test t−test 统计量形式为 t = Z / s t=Z/s t=Z/s,其中 Z Z Z 与 k k k 为已知数据的函数, k k k 为尺度参数,
t − t e s t t-test t−test 的前提假设为:
- 样本满足正态分布,均值为 μ \mu μ,方差为 σ 2 n \frac{\sigma^{2}}{n} nσ2
- s 2 s^{2} s2 满足置信度 n − 1 n-1 n−1 的卡方分布 s 2 s^{2} s2 follows a x 2 x^2 x2 distribution with n − 1 n-1 n−1 Degrees of freedom
- Z Z Z 和 s s s 相互独立
零假设 null hypothesis:一般是希望被证明为错误的假设,如“两者无关联” 或 “两者非独立” 或 “没有变化”
对立假设 Alternative hypothesis:一般是希望能证明为正确的假设,如“两者有关联” 或 “两者独立” 或 “有变化”
主要类别
One-sample t-test
可利用以下统计量 t t t 对一组来自正态分配独立样本 x i x_i xi 验证零假设总体期望值 μ μ μ 为 μ 0 μ_0 μ0 :
t = x ‾ − μ 0 s / n t=\frac{\overline{x}-\mu_{0}}{s / \sqrt{n}} t=s/nx−μ0
其中: i = 1 … n , x ‾ = ∑ i = 1 n x i n i=1 \ldots n, \overline{x}=\frac{\sum_{i=1}^{n} x_{i}}{n} i=1…n,x=n∑i=1nxi 为样本均值, μ 0 μ_0 μ0 为数学期望, s = ∑ i = 1 n ( x i − x ‾ ) 2 n − 1 s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2}}{n-1}} s=n−1∑i=1n(xi−x)2 为样本标准差, n n n 为样本数量。
该统计量 t t t 在零假设 μ = μ 0 \mu=\mu_{0} μ=μ0 为真的条件下服从置信度为 n − 1 n-1 n−1 的 Student’s t-distribution
Dependent t-test for paired samples
与单样本检验类似,不过检验对象为两组正态分布独立样本之差
两组独立正态分布样本 x 1 i x_{1i} x1i 与 x 2 i x_{2i} x2i 之差为 d i = x 1 i − x 2 i d_{i} = x_{1i} - x_{2i} di=x1i−x2i,可以利用以下统计量 t 检验 d i d_{i} di 的均值是否为 μ 0 \mu_{0} μ0。
t = d ‾ − μ 0 s d / n t=\frac{\overline{d}-\mu_{0}}{s_{d} / \sqrt{n}} t