混合线性模型如何检测固定因子和随机因子的显著性以及计算R2

最新推荐文章于 2025-03-10 20:42:59 发布

育种数据分析之放飞自我

最新推荐文章于 2025-03-10 20:42:59 发布

阅读量1.6w

点赞数 10

分类专栏：混合线性模型

互秀朋友圈呀, 微信: yijiaobani, 备注: 姓名+ 单位

本文链接：https://blog.csdn.net/yijiaobani/article/details/90045837

版权

混合线性模型专栏收录该内容

51 篇文章

订阅专栏

很多朋友写信问我，像要知道固定因子的显著性和随机因子的显著性如何计算，他们使用的是lme4这个R包, 但是这个包使用anova时没有P值,还要手动计算, 随机因子也需要自己计算loglikehood值, 然后使用LRT的卡方检验进行显著性检验, 其实lme4包有扩展的包可以非常友好的做这件事情.

1. 载入数据和软件包

###载入软件包和数据
library(lme4)
library(lmerTest)
library(sjstats)
library(learnasreml)
data(fm)

2. 软件包介绍

lme4

R语言中最流行的混合线性包
结果不太友好, 所以才有下面两个包作为辅助
安装方法

install.packages("lme4")

lmerTest

主要是用于检测lme4对象的固定因子和随机因子,它有两个函数:
lmerTest::anova.lmerModLmerTest用于检测固定因子的显著性, 方差分析表采用III平方和的形式.
lmerTest::ranova用于检测随机因子的显著性, 使用的是LRT检验, 给出的是卡方结果.
安装方法

install.packages("lmerTest")

sjstats

可以计算R2
可以提取方差组分
安装方法

install.packages("lmerTest")

3. 使用lme4进行混合线性分析

模型介绍

固定因子: Spacing + Rep
随机因子: Fam

建模

### 固定因子: Spacing+Rep, 随机因子: Fam
fm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)

固定因子检验

anova(fm1) # 固定因子显著性检验

	Sum Sq	Mean Sq	NumDF	DenDF	F value	Pr(>F)
Spacing	1775.888	1775.888	1	786.2359	34.98368	4.957481e-09
Rep	5339.632	1334.908	4	781.5386	26.29670	1.762292e-20

可以看到Spacing 和Rep都达到极显著

随机因子显著性检验

ranova(fm1) # 随机因子显著性检验,LRT

	npar	logLik	AIC	LRT	Df	Pr(>Chisq)
<none>	8	-2831.504	5679.008	NA	NA	NA
(1 \| Fam)	7	-2876.161	5766.323	89.31466	1	3.367543e-21

可以看到Fam达到极显著

计算R2

r2(fm1) # 计算R2

R-Squared for Generalized Linear Mixed Model

[34mFamily : gaussian (identity)
Formula: h1 ~ Spacing + Rep + (1 | Fam)

[39m   Marginal R2: 0.116
Conditional R2: 0.277

计算固定因子每个水平的P值


p_value(fm1) # 计算每个水平的显著性

term	p.value	std.error
(Intercept)	1.535094e-127	0.7915991
Spacing3	4.957481e-09	0.5463546
Rep2	2.886600e-01	0.8082299
Rep3	7.443430e-08	0.8218056
Rep4	1.720753e-10	0.7995633
Rep5	4.635631e-01	0.7663026

提取方差组分

re_var(fm1) # 计算方差组分

_sigma_2

50.7633345854535

Fam_tau.00

11.3168413429073

4. 使用asreml进行对照

建模

library(asreml)
fm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm,trace=F)

固定因子检验

anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asreml

	Df	Sum of Sq	Wald statistic	Pr(Chisq)
(Intercept)	1	253059.46646	4985.08358	0.000000e+00
Spacing	1	1164.71720	22.94406	1.667844e-06
Rep	4	5339.63197	105.18678	0.000000e+00
residual (MS)	NA	50.76333	NA	NA

随机因子显著性检验

这里首先构建一个空模型, 然后使用LRT检验

fm_Null = asreml(h1 ~ Spacing + Rep, data=fm,trace=F)

lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRT

	Df	LR statistic	Pr(Chisq)
fm2/fm_Null	1	89.31466	0

summary(fm2)$varcomp[,1:2] # 方差组分

	gamma	component
Fam!Fam.var	0.2229334	11.31684
R!variance	1.0000000	50.76333

5. 关于混合线性模型计算R2

还有一个包叫MuMIn,也可以计算R2

library(MuMIn)
r.squaredLR(fm1)#计算R2

0.217233511687581

6. 完整代码分享

# 混合线性模型, 如何检测固定因子和随机因子

###载入数据
library(lme4)
library(lmerTest)
library(sjstats)
library(learnasreml)
data(fm)
str(fm)

### 固定因子: Spacing+Rep, 随机因子: Fam
fm1 <- lmer(h1 ~Spacing + Rep + (1|Fam), fm)
summary(fm1)

anova(fm1) # 固定因子显著性检验
ranova(fm1) # 随机因子显著性检验,LRT

r2(fm1) # 计算R2

p_value(fm1) # 计算每个水平的显著性

re_var(fm1) # 计算方差组分


### 对比asreml
fm2 = asreml(h1 ~ Spacing + Rep, random = ~ Fam, data=fm)
anova(fm2) # 固定因子显著性检验, 这里anova 是anova.asreml
fm_Null = asreml(h1 ~ Spacing + Rep, data=fm)
lrt.asreml(fm2,fm_Null) # 随机因子显著性检验LRT
summary(fm2)$varcomp[,1:2] # 方差组分


library(MuMIn)
r.squaredLR(fm1)#计算R2

在这里插入图片描述