大数据时代的动植物育种数据分析
文章平均质量分 83
主要介绍动植物育种中, 大数据的分析方法, 主要涉及生物统计, 数量遗传, 全基因组选择(GS), 全基因组关联分析(GWAS)
育种数据分析之放飞自我
个人公众号:育种数据分析之放飞自我
展开
-
关于遗传力常见的误解
正确的解释:遗传力为0.4,就意味着表型变异中有40%是由基因型变异决定的。原创 2024-03-11 21:04:32 · 1470 阅读 · 0 评论 -
围棋与育种
最近因为娃子报名了围棋课,我本着交一次课学两个人的态度,入门围棋,买了些书,听了些课,有所得。学了两个多月,现在6级水平,了解了基本的攻杀技巧,会判断输赢。下面截图是今天的一盘棋,执黑胜利27子。围棋作为最后被计算机攻克的棋牌类游戏,它的复杂度相对于其它游戏遥遥领先,之前没有接触过,一直感觉到高深莫测,也没有机会学习,这次入门围棋让我想到了很多,写篇博客介绍一下吧。原创 2023-08-27 22:54:47 · 564 阅读 · 0 评论 -
new bing的chatGPT如何解析英文论文pdf
您好,这是必应。这篇文章的主要内容是利用单步基因组最佳线性无偏预测(ssGBLUP)方法来提高巨型淡水虾(Macrobrachium rosenbergii)体重的遗传评估效率。文章使用了410个基因分型的亲本和83,480个单核苷酸多态性(SNP)位点来估计体重的方差成分和遗传参数,并通过五折交叉验证(CV)来计算遗传值(EBV)和基因组遗传值(GEBV)的预测准确度。原创 2023-03-12 21:43:50 · 20435 阅读 · 3 评论 -
基因组选择中rrBLUP的应用案例
试试chatGPT水文的过程。原创 2023-02-13 21:07:32 · 1467 阅读 · 0 评论 -
植物育种中广义遗传力的定义
广义遗传力(H2H^2H2)定义为归因于基因型总体遗传变异的表型变异比例。通常他包括三个解释:(详见我这篇博客的公式推导回归系数 相关系数 遗传力的关系(i)它相当于观察到的表型上不可观察的基因型值的线性回归的确定系数;(ii)也是预测表型值和基因型值之间的相关系数的平方;(iii)它表示可以实现为选择响应(RR)的选择差异(SS)的比例(Falconer和Mackay,2005)。原创 2023-02-12 17:37:41 · 1095 阅读 · 0 评论 -
基因组选择中的参考群更新策略
基因组选择(GS)通常用于家畜,越来越多地用于植物育种。根据参考群体的表型和基因型,GS允许对只有基因型的年轻个体进行性能预测。这有望实现快速的高遗传增益,但可能会失去遗传多样性。现有的保护遗传多样性的方法主要取决于育种个体的选择。在本研究中,我们建议修改参考种群组成,以减轻多样性损失。由于表型的高成本是GS的限制因素,我们的发现具有重大的经济意义。这项研究旨在回答以下问题:关于参考种群的决定将如何影响繁殖种群,以及如何最佳选择个体以更新参考种群,并平衡最大化遗传增益和最小化遗传多样性损失?原创 2022-11-03 19:11:51 · 969 阅读 · 0 评论 -
vcftools如何在Linux系统中安装
这里,记录一下vcftools的安装教程。https://vcftools.github.io/examples.html下载到本地,上传到服务器中。2. 解压缩 unzip vcftools-vcftools-v0.1.16-18-g581c231.zip cd vcftools-vcftools-581c231/3. 安装 bash autogen.sh./configure makemake install安装完成日志: /usr/bin/mkdir -p原创 2022-09-25 21:01:03 · 1400 阅读 · 1 评论 -
遗传力缺失的案例
在研究人员寻找遗传性的过程中,有一种挥之不去的担忧:常见疾病实际上可能并不常见。医学试图把一系列复杂的症状混为一谈,称之为疾病。但是,如果数千种罕见的基因变异导致了一种疾病,而基因基础对不同的人可能有根本的不同,这有多普遍呢?这些实际上是不同的疾病吗?GW AS实际上可能被证明如此困难,因为研究人员正在一群可能共享很少(如果有的话)的人中寻找共享的易感基因。然而,如果对遗传学没有更深入的了解,就不可能对它们进行更好的分类。“这可能是罕见的变异,常见的疾病。这对人们来说有点可怕,因为很难找到这些东西。...原创 2022-08-06 09:59:48 · 505 阅读 · 0 评论 -
全同胞家系如何计算遗传力及育种值
全同胞家系,由同父同母所生子女的集合体称为全同胞家系。比如父本是A1,A2,A3,母本是B1,B2,B3,如果A1B1,A2A1*B1,有10个后代,分别是:A1B1_1, A1B1_2……,A1B1_10,那么这10个后代为一个全同胞家系上面共有30个个体,属于3个全同胞家系。...原创 2022-08-04 18:06:20 · 1914 阅读 · 1 评论 -
如何运行plink软件--三种方法
有小伙伴问我:同样的问题还有:你以为plink软件像word或者Excel一样?或者你以为plink软件像Python或者R语言一样?它只是一个软件,一个只能在命令行添加参数的软件,没有图形界面,没有快捷方式,不能用鼠标点击的软件。现在我提供三种方法,来运行plink软件。首先是下载软件:https://www.cog-genomics.org/plink/1.9/下载到本地,解压即可。比如windows系统,解压下如下:很多人都是先在windows键找到cmd,然后再进入相关文件夹,其实有个简单的方法:原创 2022-06-08 08:39:45 · 9238 阅读 · 1 评论 -
从数量遗传学角度介绍为何结婚要拿彩礼钱
彩礼钱,是结婚时男方给女方的钱。这里有两点:钱男方给女方俗话说:“父挫,挫一个;母挫,挫一窝”,意思是父亲影响子女,是单个影响的,而母亲影响子女,是成窝影响的。因为,从遗传的角度,子女各继承父母一半的遗传物质,但是由于是母亲细胞质(比如线粒体)也携带遗传物质,所以母亲传递给后代的遗传物质要多于父亲。所以,想要改良家族的基因和性格,男性找一个好的女性做配偶,比女性找一个好的男性做配偶,影响要更大。想到这里,忽然感觉结婚时,给女方大量的彩礼,也可以理解了。母亲对后代影响大,不只是从遗传的角度(生)原创 2022-02-13 14:00:08 · 915 阅读 · 1 评论 -
GWAS计算BLUE值4--联合方差分析演示
本篇,用书籍中的数据和结论,用R语言的一般线性模型和混合线性模型,做一下一年多点的联合方差分析的演示。1. 参考书籍《农业试验设计与统计分析》这本书是压箱底的好书,里面是用最原始的方式(公式推导和分解)介绍农业试验设计与统计分析相关的知识点,这次使用第九章 多点试验结果的联合分析,第一节,一年多点随机区组试验结果的分析的数据,作为演示。2. 什么是联合方差分析联合方差分析是一个比较内行的、比较封闭的、也可以说是比较专业的称谓,它主要应用于农业多点试验,用来评价品种的平均表现、对环境变化的反应特点以原创 2021-12-14 21:47:30 · 1383 阅读 · 0 评论 -
GWAS计算BLUE值3--LMM考虑残差异质计算BLUE值
本节,介绍如何使用R语言的asreml包拟合混合线性模型,定义残差异质,计算最佳线性无偏估计(blue)1. 试验数据数据来源: Isik F , Holland J , Maltecca C . Genetic Data Analysis for Plant and Animal Breeding. Springer International Publishing, 2017.数据及代码下载,请关注公众号:育种数据分析之放飞自我,进入知识星球进行相关下载和学习该数据有62个重组自交系(R原创 2021-12-13 20:27:42 · 677 阅读 · 0 评论 -
GWAS计算BLUE值2--LMM计算BLUE值
本节,介绍如何使用R语言的lme4包拟合混合线性模型,计算最佳线性无偏估计(blue)1. 试验数据数据来源: Isik F , Holland J , Maltecca C . Genetic Data Analysis for Plant and Animal Breeding. Springer International Publishing, 2017.数据及代码下载,请关注公众号:育种数据分析之放飞自我,进入知识星球进行相关下载和学习该数据有62个重组自交系(RIL),在4个地点原创 2021-12-12 10:12:00 · 1991 阅读 · 0 评论 -
系谱检查函数check_pedigree介绍
育种中,如何检查系谱是否正确原创 2021-12-07 20:02:19 · 1338 阅读 · 0 评论 -
孟德尔抽样与基因组选择
先说一个现象:一龙生九子,九子各不同。是什么原因造成的?龙生九子,汉语成语,读音是lóng shēng jiǔ zǐ,意思是多用来比喻同胞兄弟的各有所长,出自《玉芝堂谈荟·龙生九子》。 ----百度百科传统遗传学的理由:基因重组数量遗传学的理由:孟德尔抽样所以,什么是孟德尔抽样呢?1. 基本模型个体的每个表型值是由环境因素和遗传因素共同决定的,可以用下面公式:表型值=环境效应值+遗传效应自+残差效应值表型值 = 环境效应值 + 遗传效应自 + 残差效应值表型值=环境效应值+遗传效应自+原创 2021-10-26 20:34:24 · 509 阅读 · 0 评论 -
如何计算环境遗传相关 | 育种中的基因与环境互作
基因与环境互作1. 环境参考:http://www.isbreeding.net/common/UploadFiles/file/teaching/%E6%95%B0%E9%87%8F%E9%81%97%E4%BC%A0%E6%95%99%E5%AD%A62013/Ch7.pdf宏环境Macro-environment环境 (Environment): 环境定义为影响一个基因型表现的一组非遗传因素。非生物因素, 如土壤的物理和化学特性、气候因子(如光照,降雨量和温度)等生物因素, 包含原创 2021-05-10 22:07:22 · 1821 阅读 · 0 评论 -
见贤思齐 | R语言可视化相关性分析
1. 离体看微信群中有人聊天,浏览了一下,不同专业的内容比较分散,很多读都读不通顺,隔行如隔山,真是如此!忽然,一个朋友在里面推荐的几个R语言的公众号,学生物的推荐关注:R语言使我们的共同语言:我点进去一看:木舟笔记:https://mp.weixin.qq.com/s/Qqxa8WfKU-tiqpegqueewwR语言数据分析指南,https://mp.weixin.qq.com/s/yQqmETSQfPoNCw-osrOeGQ生信技能树:https://mp.weixin.qq.com原创 2021-04-12 20:15:08 · 2014 阅读 · 0 评论 -
学习 | 遗传力与田间试验设计
最近清理学习资料,发现了之前收藏的这个PPT,很不错,分享学习一下。原文PPT链接:http://nitro.biosci.arizona.edu/workshops/TWIPB2013/Mod1/Mod1-6.pdf1. PPT题目及作者2. 选择相应育种中选择相应是一个很重要的概念,我们对某些性状进行选择时,要有一定的知识,确保一定的选择相应来保证选择的效率。群体需要有变异,...原创 2020-03-23 20:06:49 · 1024 阅读 · 0 评论 -
asreml3r 和 asreml4r 多性状分析代码比较
代码比较:asreml4-r 多性状分析library(asreml)library(learnasreml)data("animalmodel.dat")data("animalmodel.ped")dat = animalmodel.datped = animalmodel.pedainv = ainverse(ped)# # asreml-3r# ainv = as...原创 2020-03-23 19:52:06 · 856 阅读 · 1 评论 -
不完全双列杂交种遗传力的计算方法
不完全双列杂交模型y=Mu+Gca1+Gca2+Sca+e y = Mu + Gca1 + Gca2 + Sca + ey=Mu+Gca1+Gca2+Sca+ey 是观测值Mu是截距Gca1是品本1的一般配合力Gca2 是品种2的一般配合力Sca 是特殊配合力e 是残差方法1Vm = Vf = 1/4 * VaVa = 2*(Vm + Vf)Vd = 4*Vm...原创 2020-03-23 19:51:08 · 2772 阅读 · 0 评论 -
数据分析中转化数据对结果的影响
1. 问题提出在模型假定中,数据需要符合正态分布,在动物模型分析中,如果对数据进行转化,对育种值和方差组分变化的情况,进行测试。2. 示例正常数据library(asreml)library(learnasreml)data("animalmodel.dat")data("animalmodel.ped")dat = animalmodel.datped = animalmod...原创 2019-11-26 07:58:43 · 939 阅读 · 0 评论 -
基因组选择的几个概念
1. 基因组选择:(Genomic selection)中文:基因组选择利用覆盖全基因组的高密度SNP标记, 结合表型记录或系谱记录对个体育种值进行估计, 其假定这些标记中至少有一个标记与所有控制性状的QTL处于连锁不平衡状态.英文:Genomic selection is a form of marker-assisted selection in which genetic marke...原创 2019-11-13 19:48:54 · 5496 阅读 · 2 评论 -
读文献:全基因组选择模型进展及展望
令人击节的一段话:随着全基因组选择统计模型的不断改进优化,模型的稳定性及准确性不断提高,但是依然面临两个重要的挑战,即计算准确性和计算效率;直接法(GBLUP为代表)计算效率较高,但是计算准确性略差于间接法(BayesB为代表),虽然学者对直接法进行了改进,但是由于改进的策略中人为设定参数较多,因此模型的预测准确性受主观因素影响较大;间接法计算准确性较高,但是由于参数求解过程中计算量庞大,且无法...原创 2019-10-15 08:25:31 · 2746 阅读 · 0 评论 -
全基因组选择介绍及实践-2:构建H矩阵
1, 编者自语H矩阵作为一步法的入门技术, 是需要掌握的, 本文以一篇文献为例, 介绍如何从头构建H矩阵. 文章包括H矩阵推导过程和代码实现.2, H矩阵定义基因组选择中, GBLUP的一个挑战是, 在参考群构建时, 需要两步, 第一步根据系谱和表型数据, 计算出伪数据(pseudo-data)(比如, 根据系谱计算公牛的女儿产奶偏差作为表型值, 因为公牛没有产奶数据), 然后用基因组信息进...原创 2019-01-29 20:52:51 · 2554 阅读 · 0 评论 -
全基因组选择介绍及实践-1
1, 序言这篇是基因组选择的理论加实践,因为我看到一句话,Talk is cheap. Show me the code,很有感触,有感而写。使用的包是R的sommer和asreml,其实强健的还是成熟的软件,比如DMU,BLUPF90,PIBLUP,ASreml等,但sommer作为基本功能的演示,非常合适。2, 定义基因组选择(Genomic Selection, GS), 利用覆盖全基...原创 2019-01-27 13:35:42 · 15414 阅读 · 10 评论 -
DMU软件 语法高亮 vim设置--学习笔记6
用vim编程时, DMU的关键词没有语法高亮, 看着不舒服, 就进行一下设置, 并记录过程.设置的效果如下设置流程本次设置的比较简单, 将关键词分为:模型model, 比如DMU1, DMU2…不同组成part, 比如DATA, VARIATE, MODEL…不同结构类型type, 比如PED, COR…新建DIR.vim文件, 里面设置相关参数新建DIR_suffix.vim...原创 2018-11-26 19:26:48 · 1180 阅读 · 0 评论 -
DMU-单性状动物模型-母体效应--学习笔记5
单性状动物模型-母体效应本次主要是演示如何使用DMU分析单性状动物模型-母体效应.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的animalmodel.dat和animalmodel.ped的数据.如果没有软件包, 首先安装:setwd("d:/dmu-test/")library(dev...原创 2018-11-21 19:03:14 · 1434 阅读 · 0 评论 -
DMU-多性状动物模型-学习笔记4
多性状动物模型本次主要是演示如何使用DMU分析多性状动物模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的animalmodel.dat和animalmodel.ped的数据.如果没有软件包, 首先安装:setwd("d:/dmu-test/")library(devtools)# i...原创 2018-11-19 20:47:29 · 2850 阅读 · 1 评论 -
DMU-单性状重复力模型-学习笔记3
单性状重复力模型本次主要是演示如何使用DMU分析单性状重复力模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的repeatmodel.dat和repeatmodel.ped的数据.如果没有软件包, 首先安装:setwd("d:/dmu-test/")lib原创 2018-11-18 18:13:06 · 3594 阅读 · 2 评论 -
DMU-单性状动物模型-学习笔记2
单性状动物模型本次主要是演示如何使用DMU分析单性状动物模型.数据使用learnasreml包中的数据learnasreml是我编写的辅助学习asreml的R包, 里面有相关的数据和代码, 这里我们用其中的animalmodel.dat和animalmodel.ped的数据.如果没有软件包, 首先安装:library(devtools)install_github("dengfei20...原创 2018-11-14 19:09:09 · 4070 阅读 · 1 评论 -
DMU-参数介绍-学习笔记1
DMU软件介绍DMU是一个数量遗传学工具包,主要功能包括估计方差组分和固定效应,预测育种值。DMU的开发历史可以追溯到25年前,大部分功能基于数量遗传学研究的需求而开发。在丹麦动物育种研究中,DMU是一个主要的统计研究工具(估计和预测)。此外,DMU也应用于丹麦牛,羊,貂和马等常规遗传评估研究。因此,DMU不但在一些特定的项目中具备高性能优势,也适用于常规数量遗传学研究。“DMU”名称最初来自于...原创 2018-11-14 19:00:24 · 6316 阅读 · 5 评论 -
GWAS和GS的结合:Single Step GWAS的应用
小编寄语一直以来,GWAS和GS一直是分家的,各搞各的,交叉很少。两者都是基于统计分析,GWAS重点在于找到显著性的SNP位点,找到关联性状的基因。GS的重点在于计算个体的育种值,进行排名选择。基因组选择基于BLUP的方法(GBLUP,SSGBLUP)省略了SNP效应的估算,直接计算育种值(BLUP),随着基因组选择在育种中广泛的实施,GS和GWAS的结合变得更有意义:GWAS得到的显著性...原创 2019-08-28 07:33:05 · 3590 阅读 · 0 评论