混合线性模型介绍--Wiki

最新推荐文章于 2025-02-27 14:39:21 发布

育种数据分析之放飞自我

最新推荐文章于 2025-02-27 14:39:21 发布

阅读量1.1w

点赞数

分类专栏：混合线性模型统计分析

互秀朋友圈呀, 微信: yijiaobani, 备注: 姓名+ 单位

本文链接：https://blog.csdn.net/yijiaobani/article/details/81348185

版权

混合线性模型同时被 2 个专栏收录

51 篇文章

订阅专栏

统计分析

31 篇文章

订阅专栏

模型介绍

混合线性模型： 是即包括固定因子，又包括随机因子的模型。混合线性模型被广泛应用于物理、生物和社会科学。尤其是一些重复测量的数据及面板数据。混合线性模型比较突出的特点是可以非常优秀的处理缺失值，相对于传统的方差分析，它有更广泛的使用范围，也更优秀。

发展历程

Ronald Fisher 最早提出随机因子模型来研究亲属间性状的相关性，1950年 Charles Roy Henderson 提出了最佳线性无偏估计（BLUE），这是针对于固定因子的评估。对随机因子的评估是最佳线性无偏预测（BLUP）。随后，混合模型在统计学研究中成了一个热门领域，相关的模型不断提出，比如非线性混合模型，极大似然发估计，混合模型中的缺失值处理，贝叶斯估计混合模型等。混合模型被应用在许多领域，特别是观测值之间是有关联的重复测量数据，比如动植物育种，医学，也被应用在其它领域，比如棒球，工业统计等。

定义

以矩阵定义混合模型，可以写成：

$X\beta + Z\mu + \epsilon$

这里
$y$ 是观测值的向量,它的平均值可以表示为 $X\beta$
$\beta$ 是固定因子的效应值
$\mu$ 是随机因子的效应值，它的平均值为 $E(\mu)=0$ ,.它的方差为 $var(\mu) = G$
$\epsilon$ 是残差的向量矩阵,它的平均值为 $E(\epsilon)=0$ ,.它的方差为 $var(\epsilon) = R$
$X$ 和 $Z$ 分别是是 $\beta$ 和 $\mu$ 的矩阵

计算

混合模型的假定为 $\mu ~ N(0,G), \epsilon~ N(0,R)$ , 其中 $Cov(\mu, \epsilon) = 0$ ，即两者的协方差为0.
Henderson的混合线性公式：

$\begin{bmatrix} X'X & X'Z \\ Z'X & Z'Z + A^{-1}K \end{bmatrix} \begin{bmatrix} \widehat{\mu} \\ \widehat{\alpha} \end{bmatrix}= \begin{bmatrix} X'Y \\ Z'Y \end{bmatrix}$

求解混合线性模型, $\hat{\beta}$ 和 $\hat{\mu}$ 的估计值是BLUE值和BLUP值, 求解方程组的前提是 $K$ 已知, 即而K的公式为: $K=\frac{\sigma_e^2}{\sigma_a^2}$ , 即残差的方差组分 $\sigma_e^2$ 和随机因子的方差组分 $\sigma_a^2$ 已知.