混合线性模型
文章平均质量分 75
育种数据分析之放飞自我
个人公众号:育种数据分析之放飞自我
展开
-
Error: grouping factors must have > 1 sampled level
报错:Error: grouping factors must have > 1 sampled level报错代码:分析一年多点数据,需要考虑地点和地点内区组,都用混合线性模型的随机因子。这里换为。正确的代码如下:方差组分结果:这样就搞定了!...原创 2022-07-13 19:16:27 · 1396 阅读 · 1 评论 -
BLUP育种值如何计算准确性
大家好,我是飞哥。育种值的准确性是什么呢?为何要计算育种值的准确性呢?育种值的准确性的大小可以反应育种值计算的准确性如何,如果准确性高,就说明计算育种值时依赖的信息多(比如亲子关系、同胞关系等),结果就可靠。育种值也可以计算可靠性,它是准确性的平方另外,对于不同性状或者不同试验的BLUP值的准确性进行比较时,因为方差组分、标准误、BLUP值都不一样,没有一个标准,可以用准确性(accuracy)这个指标进行比较。数据及结果来源书籍:王金玉, 陈国宏. 《数量遗传与动物育种》. 东南大学出版原创 2022-02-07 20:33:52 · 2869 阅读 · 0 评论 -
GWAS计算BLUE值3--LMM考虑残差异质计算BLUE值
本节,介绍如何使用R语言的asreml包拟合混合线性模型,定义残差异质,计算最佳线性无偏估计(blue)1. 试验数据数据来源: Isik F , Holland J , Maltecca C . Genetic Data Analysis for Plant and Animal Breeding. Springer International Publishing, 2017.数据及代码下载,请关注公众号:育种数据分析之放飞自我,进入知识星球进行相关下载和学习该数据有62个重组自交系(R原创 2021-12-13 20:27:42 · 677 阅读 · 0 评论 -
GWAS计算BLUE值2--LMM计算BLUE值
本节,介绍如何使用R语言的lme4包拟合混合线性模型,计算最佳线性无偏估计(blue)1. 试验数据数据来源: Isik F , Holland J , Maltecca C . Genetic Data Analysis for Plant and Animal Breeding. Springer International Publishing, 2017.数据及代码下载,请关注公众号:育种数据分析之放飞自我,进入知识星球进行相关下载和学习该数据有62个重组自交系(RIL),在4个地点原创 2021-12-12 10:12:00 · 1991 阅读 · 0 评论 -
GWAS计算BLUE值1--计算最小二乘均值(lsmeans)
本节,介绍如何使用R语言的lm拟合一般线性模型,计算最小二乘均值(lsmeans)1. 试验数据数据来源: Isik F , Holland J , Maltecca C . Genetic Data Analysis for Plant and Animal Breeding. Springer International Publishing, 2017.数据及代码下载,请关注公众号:育种数据分析之放飞自我,进入知识星球进行相关下载和学习该数据有62个重组自交系(RIL),在4个地点进行原创 2021-12-12 10:11:39 · 2389 阅读 · 0 评论 -
混合线性模型不同模型拟合的可视化
1. 数据这里使用sleepstudy数据集,看一下免费的R包lme4和付费包asreml如何处理不同的混合线性模型,以加深对混合线性模型的理解。数据描述:睡眠剥夺研究中受试者每天的平均反应时间。第0天,受试者有正常的睡眠时间。从那天晚上开始,他们每晚只能睡3个小时,依次进行0~9天。观察结果(y变量)代表了每天对每个受试者进行的一系列测试的平均反应时间。数据预览:> head(dat) Reaction Days Subject1 249.5600 0 3082原创 2021-05-12 22:00:05 · 4165 阅读 · 0 评论 -
lme4包中的lmer函数语法介绍
1. 模型解释lmer常用模型公式如下:mod= lmer(data = , formula = y ~ Fixed_Factor + (Random_intercept + Random_Slope | Random_Factor))data,为数据集y,为观测值,所要分析的性状,因变量Fixed_Factor,为固定因子()内为随机因子Random_intercept,为随机截距,即认为不同群体因变量的分布不同(通俗的解释:有的人生下来起点高,是富二代,有的人是一般群众,起点低)R原创 2021-05-12 20:47:29 · 12757 阅读 · 1 评论 -
遇到bug不要慌,都是小场面。
1. 澄清今天早上准备跑步,看到外面雾蒙蒙的,好像是下雨了。也只是好像下雨了,不一定真下呢,毕竟眼见不一定为实,一定要亲身实践,小马过河才可以。所谓不淋雨不知道雨是真实的,不挨揍不知道铁拳的味道,等到下楼雨滴滴到脸上头上的那一刻,我就怂了,上去,这天还去跑步就是一个铁憨憨!所以,澄清:不是不跑步,而是没有跑步的条件,把怂说成敬业是职场老油条的典型标志,...原创 2020-11-17 12:11:34 · 440 阅读 · 0 评论 -
分类变量logistic回归分析--1
1. 二分类logistic回归分析2. 多分类logistic回归分析因变量(y变量)是多分类的,包括无序和有序的。无序的多类别因变量:对应无序多分类logistic回归模型有序的多类别因变量:有序多分类logistic回归模型2.1 无序多分类logistic回归分析2.2 有序多分类logistic回归分析...原创 2020-09-23 22:58:49 · 9023 阅读 · 2 评论 -
笔记 | GWAS 操作流程4-1:LM模型assoc
1. GWAS笔记操作计划之前的教程中,我们使用的是别人模拟的数据,数据类型是二分类数据,这里我们模拟一个数量性状的连续性状,做GWAS更有代表性。我们先从没有协变量的一般线性模型(LM)模型开始,然后加入数据类型的协变量,然后加入因子类型的协变量(这里需要进行虚拟变量的转化),然后将数值协变量和因子变量放在一起作为协变量,然后将PCA的值作为协变量加进去,这样一般线性模型分析完成。最后我们使用混合线性模型(LMM),不考虑协变量,然后加入协变量,然后将PCA加入协变量。最最后介绍一下可视化,包括曼原创 2020-05-19 00:09:05 · 4462 阅读 · 4 评论 -
遗传评估分析之模板文章
1. 参考文献伊犁马体尺性状非遗传因素分析及遗传参数估计[J]. 畜牧兽医学报, 2017(10).2. 试验数据描述研究所用数据取自伊犁某2个规模化养马场及参加伊犁马常态化赛事参赛马匹。数据中的体尺指标包括体高(体长(胸围和管围)4个性状。3. 固定因子划分场性别年龄出生年度4. 数据清洗标准提出错误数据删除3倍标准差数据5. 统计分析5.1 表型数据汇...原创 2020-05-18 18:46:19 · 909 阅读 · 0 评论 -
翻译学习 | 混合线性模型的思考
1. 前言这篇文档,是为那些想了解混合线性模型的人准备。 某些部分适合于应用学科中任何人,而其知识不多于标准回归的知识(例如,开始,模型1-2,结束),而其他部分则假定您熟悉矩阵符号和/或其他相对高级的知识。 希望背景各异的人们可以发现它有用。这样做的动机是,可以打开涉及混合模型的内容的不同资源,并觉得他们没有人在谈论同一件事。 他们将使用不同的术语和不同的模型描述,并且在阅读了一些描述后可能...原创 2020-05-04 15:21:31 · 1624 阅读 · 0 评论 -
混合线性模型学习笔记4
1. 题目: 混合线性模型理论12. 大纲3. 一般线性模型原创 2020-05-04 14:56:57 · 1151 阅读 · 0 评论 -
混合模型学习笔记3
1. 标题2. 几个概念什么是因子,什么是水平?因子间的交互3. 什么是平衡数据4. R代码操作################################################################### 02429 - Analysis of correlated data: Mixed Linear Models ###### R-script...原创 2020-05-04 14:56:20 · 678 阅读 · 0 评论 -
混合线性模型学习笔记2
1. 模块划分2. 一个简单的示例查看两种商品,是否一致,HPLC和NIR。那么可以利用配对T检验,进行分析:setwd("C:\\Users\\Dengfei\\Desktop\\reml\\mixed-model\\alldata")hpnir1 <- read.table("hplcnir1.txt", header = TRUE, sep = ",", dec = "...原创 2020-05-04 14:55:53 · 1683 阅读 · 0 评论 -
混合线性模型学习笔记1
1. 课程来源:https://02429.compute.dtu.dk/Frontpage需要安装的R包install.packages(c('lmerTest', 'lsmeans', 'car', 'multcomp', 'ggplot2', 'knitr'))2. 课程面向对象一般课程目标利用混合线性模型在农业,食品科学,生物学,医学和技术科学中的应用,获得有关数据统计分析...原创 2020-05-04 14:55:18 · 1665 阅读 · 1 评论 -
笔记 GWAS 操作流程2-1:缺失质控
GWAS分析时,拿到基因型数据,拿到表型数据,要首先做以下几点:1, 查看自己的表型数据,是否有问题2,查看自己的基因型数据,是否有问题然后再进行建模,得到显著性SNP以及可视化结果。清洗数据的时间占80%的时间,有句话这样讲:“Garbage in, Garbage out(垃圾进,垃圾出)”,所以清洗数据非常重要,今天学习一下基因组数据如何清洗。1. plink数据转化数据使用...原创 2020-04-06 11:51:39 · 6377 阅读 · 2 评论 -
笔记 | GWAS 操作流程1:下载数据
参考:https://github.com/MareesAT/GWA_tutorial/1. 下载数据和代码在linux环境下,新建一个文件夹,进入后运行下面命令:git clone https://github.com/MareesAT/GWA_tutorial.git下载之后,目录如下:.└── GWA_tutorial ├── 1_QC_GWAS.zip ├...原创 2020-04-05 12:52:42 · 7784 阅读 · 2 评论 -
学习 | 遗传力与田间试验设计
最近清理学习资料,发现了之前收藏的这个PPT,很不错,分享学习一下。原文PPT链接:http://nitro.biosci.arizona.edu/workshops/TWIPB2013/Mod1/Mod1-6.pdf1. PPT题目及作者2. 选择相应育种中选择相应是一个很重要的概念,我们对某些性状进行选择时,要有一定的知识,确保一定的选择相应来保证选择的效率。群体需要有变异,...原创 2020-03-23 20:06:49 · 1024 阅读 · 0 评论 -
如何计算多年多点的BLUE值
1. 为何要计算BLUE值?一年多点或者多年多点的植物数据中,一个基因型(品种)往往有多个表型数据,但只有一个基因型,在GWAS关联分析中,就需要一个基因型对应一个表型数据。之所以有多个表型数据,或者是多个重复,或者是多个地点的数据,或者是多个年份的数据,如何计算得到一个表型数据呢?可以使用多个表型值的平均值,作为品种的表型值,现在有更好的方法:BLUE值。2. 为何使用BLUE值?一般...原创 2020-03-23 19:52:52 · 5171 阅读 · 2 评论 -
asreml3r 和 asreml4r 多性状分析代码比较
代码比较:asreml4-r 多性状分析library(asreml)library(learnasreml)data("animalmodel.dat")data("animalmodel.ped")dat = animalmodel.datped = animalmodel.pedainv = ainverse(ped)# # asreml-3r# ainv = as...原创 2020-03-23 19:52:06 · 858 阅读 · 1 评论 -
不完全双列杂交种遗传力的计算方法
不完全双列杂交模型y=Mu+Gca1+Gca2+Sca+e y = Mu + Gca1 + Gca2 + Sca + ey=Mu+Gca1+Gca2+Sca+ey 是观测值Mu是截距Gca1是品本1的一般配合力Gca2 是品种2的一般配合力Sca 是特殊配合力e 是残差方法1Vm = Vf = 1/4 * VaVa = 2*(Vm + Vf)Vd = 4*Vm...原创 2020-03-23 19:51:08 · 2773 阅读 · 0 评论 -
读文献:全基因组选择模型进展及展望
令人击节的一段话:随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率;直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法...原创 2019-10-15 08:25:31 · 2746 阅读 · 0 评论 -
GWAS和GS的结合:Single Step GWAS的应用
小编寄语一直以来,GWAS和GS一直是分家的,各搞各的,交叉很少。两者都是基于统计分析,GWAS重点在于找到显著性的SNP位点,找到关联性状的基因。GS的重点在于计算个体的育种值,进行排名选择。基因组选择基于BLUP的方法(GBLUP,SSGBLUP)省略了SNP效应的估算,直接计算育种值(BLUP),随着基因组选择在育种中广泛的实施,GS和GWAS的结合变得更有意义:GWAS得到的显著性...原创 2019-08-28 07:33:05 · 3590 阅读 · 0 评论 -
混合线性模型笔记2:概念解释
1. 混合模型公式的表示方法混合线性模型y=Xb+Zu+e y = Xb + Zu + e y=Xb+Zu+e[ue]∼N([00],[G(σg)00R(σγ)]) \begin{bmatrix} u\\e \end{bmatrix} \sim N (\begin{bmatrix}0\\0\end{bmatrix},\begin{bmatrix} G(\sigma_g) &am...原创 2020-05-04 14:53:36 · 2581 阅读 · 0 评论 -
不同试验设计遗传力的计算方法
前言农业和林业, 经常涉及到要计算遗传力的问题, 这是一个数量遗传学问题. 和动物计算遗传力不同, 植物和林木计算遗传力时, 一般是使用家系遗传力, 动物计算遗传力一般是计算个体遗传力.他们的主要区别在于, 计算家系遗传力时, 需要根据重复数, 对方差组分进行校正.1, 单因素随机区组比如有10个品种, 在一个地点有3次重复, 表型数据是小区的产量和百粒重, 试计算产量和百粒重的遗传力....原创 2019-02-28 20:50:05 · 9482 阅读 · 1 评论 -
R语言中矩阵常用的操作(笔记)
1.1 矩阵的生成生成一个4行4列的矩阵,这里用1~16数字。mat <- matrix(1:16,4,4)mat 1 5 913 2 6 1014 3 7 1115 4 8 12161.2 提取主对角线diag(mat) 1 6 11 161.3 生成对角线为1的对角矩阵m1 <- diag(4)m1 1000 010原创 2017-12-23 15:03:46 · 69864 阅读 · 0 评论 -
混合线性模型笔记1:模型假定
1. 混合模型假定y=Xb+Zu+e y = Xb + Zu +ey=Xb+Zu+e解释y为观测值向量b为固定因子效应值向量(BLUE)X为固定因子关系矩阵u为随机因子效应值向量(BLUP)Z为随机因子关系矩阵e为残差向量假定E(u) = 0 # 即BLUP值的平均值为0Var(u) = G # 即BLUP值的方差为GE(e)= 0 # 残差平均值为0Var(e) ...原创 2019-08-27 06:46:12 · 1875 阅读 · 0 评论 -
asreml 设定初始值 固定初始值
1. 背景一个朋友问我,如何固定asreml的初始值,现在分为单性状和多性状进行说明。为何要固定初始值:1,由于群体较小,估算的方差组分不准确,需要手动设定初始值,直接进行求解2,有些群体数据,估算方差组分不收敛,需要手动固定初始值为何要设定初始值:1,从头进行估算,模型运行时间较长,根据先验信息,手动设定初始值,迭代收敛速度更快2,多性状分析中,模型不容易收敛,手动设定初始值,更容...原创 2019-07-23 08:16:41 · 681 阅读 · 0 评论 -
DYD 女儿产量离差 什么鬼
DYD:Daughter Yield Deviation女儿产量离差,一般是为了计算公牛的产奶量,而进行的计算。DYD=0.5BVsire+MendeliansamplingDYD=0.5BVsire+Mendeliansampling DYD = 0.5 BV_{sire} + Mendelian sampling 平均值 E(DYD)=0.5BVsireE(DYD)=0.5BVs...原创 2018-08-03 15:52:15 · 552 阅读 · 0 评论 -
混合线性模型介绍--Wiki
模型介绍混合线性模型:是即包括固定因子,又包括随机因子的模型。 混合线性模型被广泛应用于物理、生物和社会科学。尤其是一些重复测量的数据及面板数据。混合线性模型比较突出的特点是可以非常优秀的处理缺失值,相对于传统的方差分析, 它有更广泛的使用范围,也更优秀。发展历程Ronald Fisher 最早提出随机因子模型来研究亲属间性状的相关性,1950年 Charles Roy Hende...原创 2018-08-01 21:04:37 · 11737 阅读 · 3 评论 -
synbreed R包学习系列1
这是标题 只能说, csdn的写作环境太棒了, 特别是markdown中快捷键的使用, 写起来特别流畅, 我很喜欢这种感觉. 没事可干, 就用写博客的形式学习. 小鼠数据数据描述 * 2527个个体有表型 * 两个性状:体重和日增重 * 1940个个体有基因型, 12545个SNP位点处理思路1, 将测序的个体表型值提取出来2, 清洗SNP数据3, 计...原创 2018-07-31 21:08:19 · 1863 阅读 · 0 评论 -
R语言 Julia以及全基因组选择
小编著: 最近在学Julia语言,想测试一下和R的区别,发现前辈的博客,翻译时不禁感慨,这是2018年了,博客是2010年的,8年已过,我才听说Julia。但……不晚! 文章来源: https://www.r-bloggers.com/r-julia-and-genome-wide-selection/我想起一些琐事的事情,以及一些断裂的代码,在2010年我参加了基因组选择的sum...原创 2018-08-03 18:10:43 · 1903 阅读 · 0 评论 -
R语言使用矩阵操作回归分析
用矩阵的方法计算回归分析参数1.1 数据来源:来源R语言默认的数据集women这是一个描述女性身高和体重的数据,我们以height为X变量(自变量),以weight为Y变量(因变量),进行模型的计算。 计算方法参考:https://stats.idre.ucla.edu/r/library/r-library-matrices-and-matrix-computations-in-r/1.2原创 2017-12-24 16:28:42 · 6018 阅读 · 1 评论 -
asreml-r 在运行中不收敛怎么办?
在asreml-r运行中,经常遇到模型不收敛的情况,这里我们介绍3种方法来解决不收敛的情况。导入数据和模型library(asreml) # load the package data(“harvey”) head(harvey) str(harvey)ped <- harvey[,1:3] ainv <- asreml.Ainverse(ped)$ginv head(ainv)运行单性原创 2017-04-06 18:28:47 · 2194 阅读 · 0 评论 -
关于遗传参数评估的培训通知
asreml介绍ASReml是拟合线性混合模型的优秀数据分析软件,由NSW Department of Primary Industries的Arthur Gilmour博士开发,可利用灵活的混合线性模型和广义线性模型来处理大规模的数据,实现大数据高效、快速的分析。ASReml可对数量性状、阈值性状、分类性状、SNP标记等多个性状进行分析,并可实现固定效应、随机效应值的预测以及显著性检验、遗传原创 2017-04-05 10:17:51 · 998 阅读 · 0 评论 -
如何将原始SNP信息转化为0,1,2的矩阵形式
导入示例数据library(SNPassoc)data(SNPs)SNPs[1:8,1:8]idcascosexblood.preproteinsnp10001snp10002snp10003 1 1 Female 13.7 75640.52TT CC GG 2 1 Female 12.7原创 2017-03-08 12:11:47 · 10494 阅读 · 9 评论 -
如何利用SNP信息计算亲缘关系G矩阵
## 生成SNP文件信息# create marker data for 9 SNPs and 10 homozygous individualssnp9 <- matrix(c( "AA", "AA", "AA", "BB", "AA", "AA", "AA", "AA", NA, "AA", "AA", "BB", "BB", "AA",原创 2017-03-08 10:53:37 · 9677 阅读 · 9 评论 -
fread 读取文件时 数字按照因素进行读取的方法 colClasses = "Levels"
背景使用asreml分析数据时, 得到的是sln数据,进行多性状分析或者随机回归分析时,sln中的Level是1.001,小数点前面的1表示第一个性状,后面的001表示ID。有时候需要将1.001分为1和001,R中的tidyverse中的separate可以分割,但是由于data.table中的fread读取时,将1.001当作数字,在分割时,1.010和1.100都分割为1,这明显是错...原创 2018-09-02 11:33:51 · 772 阅读 · 0 评论 -
全基因组选择中准确性的影响因素
文章目的: 比较全基因组选择中准确性的影响因素 https://www.researchgate.net/publication/326489349_Prediction_accuracies_of_genomic_selection_in_American_mink_a_simulation_study主要考虑的因素有:比较不同方法: BLUP, GBLUP, SSBLUP...原创 2018-09-02 12:29:33 · 2466 阅读 · 0 评论