概率论与数理统计教程(八)-方差分析与回归分析02：多重比较

u013250861

已于 2024-02-12 20:45:09 修改

阅读量469

点赞数 7

分类专栏：概率论与数理统计文章标签：概率论

于 2024-02-11 00:18:50 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/136093610

版权

本文介绍了在概率论与数理统计中的多重比较方法，重点讲解了在方差分析后如何进行不同水平均值的显著性比较。通过T法和S法处理重复数相等和不等的情况，以确定不同因素水平间是否存在显著差异。通过实例详细解释了计算过程和判断标准，帮助理解如何在实际问题中应用这些统计方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

§8.2 多重比较
8.2.1 水平均值差的置信区间
如果方差分析的结果是因子 $A$ 显著, 则等于说有充分理由认为因子 $A$
各水平的效应不全相同,但这并不是说它们中一定没有相同的. 就指定的一对水平
$A_{i}$ 与 $A_{j}$ , 我们可通过求 $\mu_{i}-\mu_{j}$
的区间估计来进行比较,方法如下:由 (8.1.27) 式可以推出
$\bar{y}_{i .}-\bar{y}_{j,} \sim N\left(\mu_{i}-\mu_{j},\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right) \sigma^{2}\right),$
而定理 8.1 .2 指出 $S_{e} / \sigma^{2} \sim \chi^{2}\left(f_{e}\right)$ ,
且两者独立, 故
$\frac{\left(\bar{y}_{i} \cdot-\bar{y}_{j .}\right)-\left(\mu_{i}-\mu_{j}\right)}{\sqrt{\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right) \frac{S_{e}}{f_{e}}}} \sim t\left(f_{e}\right) .$
由此给出 $\mu_{i}-\mu_{j}$ 的置信水平为 $1-\alpha$ 的置信区间为
$\left[\bar{y}_{i+}-\bar{y}_{j \cdot} \pm \sqrt{\left(\frac{1}{m_{i}}+\frac{1}{m_{j}}\right)} \hat{\sigma} \cdot t_{1-\frac{a}{2}}\left(f_{e}\right)\right],$
其中 $\hat{\sigma}^{2}=S_{e} / f$ , 是 $\sigma^{2}$ 的无偏估计.
根据置信区间与双侧假设检验间的对应关系 ( §7.2.2) 知: (8.2.1)
式给出的置信区间就是两正态均值差的检验问题:
$H_{0}: \mu_{i}-\mu_{j}=0 \quad \text { vs } H_{1}: \mu_{i}-\mu_{j} \neq 0$
的接受域 $\bar{W}$ . 若该置信区间含有 0 ,则可认为 $\mu_{i}$ 与 $\mu_{j}$
间无显著差异; 若该区间不含有 0 ,则认为 $\mu_{i}$ 与 $\mu_{j}$
间有显著差异.具体见下面例子.
例 8.2.1 在例 8.1.2 中, 我们已知饲料因子是显著的, 此处
$m_{1}=m_{2}=m_{3}=8, f_{e}=21$ ,
$\hat{\sigma}=\sqrt{1343.61}=36.66$ , 若取 $\alpha=0.05$ , 则
$t_{1-\alpha / 2}\left(f_{e}\right)=t_{0.975}(21)=2.0796, \sqrt{\frac{1}{8}+\frac{1}{8}}$ .
$t_{0.975}(21) \hat{\sigma}=38.12$ ,于是可算出 3 对均值差的置信区间为
$\begin{array}{ll} \mu_{1}-\mu_{2}: & {[-48.88 \pm 38.12]=[-87,-10.76],} \\ \mu_{1}-\mu_{3}: & {[-20 \pm 38.12]=[-58.12,18.12],} \\ \mu_{2}-\mu_{3}: & {[28.88 \pm 38.12]=[-9.24,67] .} \end{array}$

这三个置信区间中只有 $\mu_{1}-\mu_{2}$ 的置信区间不含有 0 , 故 $\mu_{1}$
与 $\mu_{2}$ 间有显著差别, 其他 $\mu_{1}$ 与 $\mu_{3}$ 或 $\mu_{2}$ 与
$\mu_{3}$ 间均无显著差别.
我们看到, (8.2.1) 式给出的置信区间与第六章中的两样本的 $t$
区间基本一致，区别在于这里 $\sigma^{2}$ 的估计使用了全部样本而不仅仅是
$A_{i}, A_{j}$ 两个水平下的观测值.
8.2.2 多重比较问题
这里遇到一个新的问题, 对每一组 $(i, j), (8.2.1)$
式给出的区间的置信水平都是 1- $\alpha$ , 但对多个这样的区间,
要求其同时成立, 其联合置信水平就不再是 $1-\alpha$ 了. 譬如, 设
$E_{1}, E_{2}, \cdots, E_{k}$

最低0.47元/天解锁文章