UA MATH571B 试验设计III 单因素试验设计3

最新推荐文章于 2020-12-09 06:20:30 发布

一个不愿透露姓名的孩子

最新推荐文章于 2020-12-09 06:20:30 发布

阅读量290

点赞数

分类专栏：统计学文章标签：统计学

本文链接：https://blog.csdn.net/weixin_44207974/article/details/104894398

版权

统计学专栏收录该内容

102 篇文章 41 订阅

订阅专栏

本文介绍了在单因素ANOVA模型中进行对比(Contrast)分析的方法，包括常数对比的t检验和正交对比的概念。接着讨论了多个对比的联合推断，如Bonferroni调整和Scheffe方法。此外，还详细阐述了配对比较的Tukey检验、Fisher LSD方法和Dunnett方法，这些方法用于比较不同处理组的均值差异。

摘要由CSDN通过智能技术生成

在单因素ANOVA模型中，有时需要对treatment effect做一些其他比较。以下方法就是用来各种不同的比较的。

Contrast

在均值模型中
$y_{ij} = \mu_i+ \epsilon_{ij},\epsilon_{ij}\sim_{iid}N(0,\sigma^2)\\ i = 1,2,\cdots,a; j=1,2,\cdots,n$
假设要做下列假设检验
$H_0:L = \sum_{i=1}^a c_i \mu_i=L_0$
其中 $c_i$ 可以是任何常数。先考虑 $L$ 的估计量
$\hat{L} = \sum_{i=1}^a c_i \hat{\mu}_i = \sum_{i=1}^a c_i \bar{y}_{i.}$
显然这个估计量是正态的，其方差为
$Var(\hat{L}) = \sum_{i=1}^a c_i^2 Var(\bar{y}_{i.}) =\sum_{i=1}^a c_i^2 \frac{\sigma^2}{n_i}$
其中 $\sigma^2$ 的估计量是 $M S E$ ，由此可以构造t统计量
$\frac{\hat{L}-L_0}{\sqrt{MSE \sum_{i=1}^a \frac{c_i^2 }{n_i}}} \sim t(N-a)$
用t检验来做。
在上面的线性组合中，如果 $\sum_{i=1}^a c_i=0$ ，则称这样的线性组合为一个contrast，定义此时的线性组合为 $\Gamma = \sum_{i=1}^a c_i\mu_i$ ，通常关于constrast的检验是 $H_0:\Gamma=0$ ，这个检验也用t检验做。如果两个contrast的系数 $c_i$ 和 $d_i$ 满足
$\sum_{i=1}^a c_id_in_i=0$
则称这两个contrast正交。需要注意的是contrast是在试验之前要设计好的，避免做了试验拿到了数据之后再来选哪些检验能显著！

多个contrast的联合推断

假设要做多个contrast的假设检验
$H_0:\Gamma_1=\Gamma_{10},\cdots,\Gamma_m=\Gamma_{m0}$
假设 $CI_1,\cdots,CI_m$ 是每一个contrast的 $100(1-\alpha)\%$ 置信区间，则
$P(\Gamma_{i0} \notin CI_i|H_0)=\alpha$
但要要拒绝原假设，只需要任一 $\Gamma_{i0} \notin CI_i$ ，根据Bonferroni不等式，假设要让在原假设成立时拒绝原假设的概率保持为 $\alpha$ ，需要 $P(\Gamma_{i0} \notin CI_i|H_0)=\alpha'$
$P(at\ least\ one\ i\, \Gamma_{i0} \notin CI_i|H_0) \le \sum_{i=1}^m P(\Gamma_{i0} \notin CI_i|H_0) = m\alpha'$
近似地可以有 $\alpha'=\alpha/m$ 。如果这些 $c o n s t r a s t$ 是正交了，它们的估计量就是独立的，因此上式可以直接取等，并且可以用一个ANOVA同时做这个检验。 $\alpha'=\alpha/m$ 表明如果希望假阳性是 $\alpha$ ，那么每一个置信区间 $CI_i$ 需要用置信水平 $100(1-\alpha/m)\%$ 来构造，这种做联合推断的调整叫Bonferroni调整。
另一种做联合推断的方法是Scheffe方法。根据Scheffe方法构造的单个contrast的置信区间为
$\hat{\Gamma}_i - \sqrt{(a-1)F_{\alpha,a-1,N-a}} \sqrt{MSE \sum_{i=1}^a \frac{c_i^2 }{n_i}}\le \Gamma_i \le \hat{\Gamma}_i + \sqrt{(a-1)F_{\alpha,a-1,N-a}} \sqrt{MSE \sum_{i=1}^a \frac{c_i^2 }{n_i}}\le \Gamma_i$
如果 $m$ 比较大就用Scheffe，如果 $m$ 比较小就用Bonferroni。

配对比较

假设要对所有的treatment group mean做两两比较， $\forall i \ne j$
$H_0: \mu_i = \mu_j \\ H_a: \mu_i \ne \mu_j$

Tukey检验

如果试验是平衡的，可以用Tukey检验，如果试验是不平衡的，可以用Tukey-Kramer方法。因为思路都一样，这里介绍Tukey检验。首先构造
$q=\frac{\bar{y}_{max}-\bar{y}_{min}}{\sqrt{MSE/n}}$
其中 $\bar{y}_{max}$ 与 $\bar{y}_{min}$ 是待比较的 $p$ 个组内平均的最大值和最小值，它的分布可以查表，记为 $q_{\alpha}(p,f)$ ，其中 $\alpha$ 是百分比， $q_{\alpha}$ 代表上分位点， $f$ 是 $M S E$ 的自由度。Tukey检验给出的 $\mu_i-\mu_j$ 的置信区间边界
$\bar{y}_{i.} - \bar{y}_{j.} \pm q_{\alpha}(a,f)\sqrt{MSE/n}$

Fisher Least Significant Difference方法

因为两总体比较 $\mu_i-\mu_j$ 的置信区间边界可以写成
$\bar{y}_{i.} - \bar{y}_{j.} \pm t_{\alpha/2,N-a}\sqrt{MSE(\frac{1}{n_i}+\frac{1}{n_j})}$
定义
$t_{\alpha/2,N-a}\sqrt{MSE(\frac{1}{n_i}+\frac{1}{n_j})}$
为Least Significant Difference，代表置信区间的长度。用这个值进行比较的过程是计算 $|\bar{y}_{i.} - \bar{y}_{j.}|$ ，如果比LSD大就认为 $\mu_i-\mu_j$ 显著异于0。

Dunnett方法

如果有一组是对照组，那么实验组的结果都要与它比较。假设对照组是第 $a$ 组，则需要做的假设检验是 $\forall i=1,\cdots,a-1$ ，
$H_0: \mu_i = \mu_a \\ H_a:\mu_i \ne \mu_a$
Dunnett方法与Fisher LSD比较像，都是给一个判别值判断均值的差是否超过了判别值。Dunnett方法的判别值是
$d_{\alpha}(a-1,N-a)\sqrt{MSE(\frac{1}{n_i}+\frac{1}{n_j})}$
需要注意的是 $\alpha$ 是这 $a - 1$ 个假设检验的联合type I error。