引言
由于中心极限定理CLT,在生活和研究中,许多随机变量都服从正态分布。对于从服从正态分布的整体中抽取出的独立同分布样本,可以用t-统计量来进行对样本均值的假设检验。
检验样本均值是否等于某个常数时,我们可以用单样本t检验。对于两个服从正态分布的样本,在样本方差相同时,我们可以用两样本t检验来比较样本均值。当方差不同时,需要用Welch’s Approximation来进行调整
t分布和非中心t分布
如果
- Z ∼ N ( 0 , 1 ) Z\sim N(0,1) Z∼N(0,1)
- X ∼ χ m 2 X\sim \chi_{m}^2 X∼χm2
- Z , X Z,X Z,X 独立
那么 Z X / m ∼ t m \frac{Z}{\sqrt{X/m}}\sim t_m X/mZ∼tm,有m个自由度的t分布。
如果
- γ \gamma γ是一个常数
- Z ∼ N ( 0 , 1 ) Z\sim N(0,1) Z∼N(0,1)
- X ∼ χ ν 2 X\sim \chi_{\nu}^2 X∼χν2
- Z , X Z,X Z,X 独立
那么 Z + γ X / μ \frac{Z+\gamma}{\sqrt{X/\mu}} X/μZ+γ,服从有 ν \nu ν个自由度的非中心t分布。 γ \gamma γ被称为非中心参数。
单样本t检验
- 抽样模型 Y 1 , Y 2 , . . . , Y n ∼ i . i . d . N ( μ , σ 2 ) Y_1, Y_2, ..., Y_n \sim i.i.d. \ N(\mu, \sigma^2) Y1,Y2,...,Yn∼i.i.d. N(μ,σ2)
- Null Hypothesis H 0 : μ = μ 0 H_0:\mu = \mu_0 H0:μ=μ0
- Alternative Hypothesis H 1 : μ ≠ μ 0 H_1:\mu \neq \mu_0 H1:μ=μ0
- test statistics under null hypothesis t ( Y ) = n ( Y ˉ − μ 0 ) / s t(\bm{Y})=\sqrt{n}(\bar{Y}-\mu_0)/s t(Y)=n(Yˉ−μ0)/s
- Null distribution t ( Y ) ∼ t n − 1 t(\bm{Y})\sim t_{n-1} t(Y)∼tn−1
注意,当数据服从正态分布但 μ ≠ μ 0 \mu \neq\mu_0 μ=μ0,则 t ( Y ) t(\bm{Y}) t(Y)服从非中心 t 分布,我们可以用它来计算检验的势力
但如果数据不服从正态分布,则 t ( Y ) t(\bm{Y}) t(Y)不服从 t 分布 - p值 p = P ( ∣ t ( Y ) ∣ ≥ ∣ t ( y ) ∣ ∣ H 0 ) = P ( ∣ T n − 1 ∣ ≥ ∣ t ( y ) ∣ ) p = P(|t(\bm{Y})|\geq |t(\bm{y})| \bm{|}H_0) = P(|T_{n-1}|\geq |t(\bm{y})|) p=P(∣t(Y)∣≥∣t(y)∣∣H0)=P(∣Tn−1∣≥∣t(y)∣)其中 y \bm{y} y是实验观测到的数据
- α \alpha α精确度下的判别过程:
如果p值小于等于 α \alpha α或者 ∣ t ( y ) ∣ ≥ t ( n − 1 ) , 1 − α / 2 |t(\bm{y})|\geq t_{(n-1),1-\alpha /2} ∣t(y)∣≥t(n−1),1−α/2那么我们可以拒绝原假设。
注意:
t ( Y ) t(\bm{Y}) t(Y)服从 t 分布是因为 Y 1 , Y 2 , . . . , Y n ∼ i . i . d . N ( μ , σ 2 ) Y_1, Y_2, ..., Y_n \sim i.i.d. \ N(\mu, \sigma^2) Y