数量遗传学
文章平均质量分 79
育种数据分析之放飞自我
个人公众号:育种数据分析之放飞自我
展开
-
植物育种中广义遗传力的定义
广义遗传力(H2H^2H2)定义为归因于基因型总体遗传变异的表型变异比例。通常他包括三个解释:(详见我这篇博客的公式推导回归系数 相关系数 遗传力的关系(i)它相当于观察到的表型上不可观察的基因型值的线性回归的确定系数;(ii)也是预测表型值和基因型值之间的相关系数的平方;(iii)它表示可以实现为选择响应(RR)的选择差异(SS)的比例(Falconer和Mackay,2005)。原创 2023-02-12 17:37:41 · 1138 阅读 · 0 评论 -
根据系谱数据查看个体间关系
当然,上面品种较多,可视化不太直观,如果挑选出感兴趣的少数个体(比如20~50个),用上面的方法是非常方便的。首先,这是三列系谱数据,我们需要将其转为15列系谱数据,包括每个个体的三个世代的数据。邓老师,想问一下如何根据猪场子代父母代数据找出它们之间的系谱关系图呢,最好是方便统计的那种。相关的数据和代码,我上传到了我的知识星球,欢迎感兴趣的小伙伴下载使用。上一步中,得到的系谱还有937条,我们对着937条系谱进行可视化。以上就是根据系谱查看个体间关系的三种方法,希望对大家有所帮助。系谱可视化,可以使用。..原创 2022-08-11 09:31:34 · 528 阅读 · 0 评论 -
数量遗传学遗传力计算2:半同胞和全同胞
1. 半同胞2. 全同胞3. 同卵双胞胎汇总:原创 2022-08-08 08:38:56 · 2135 阅读 · 0 评论 -
数量遗传学遗传力计算1:亲子回归方法
遗传力定义遗传力是育种值对表型值的回归系数。遗传力,是育种值与表型值相关系数的平方。1. 后代与一个亲本方差组分的计算:2. 后代与中亲值方差组分:这样,计算的斜率就是遗传力和标准误。......原创 2022-08-08 08:38:01 · 968 阅读 · 0 评论 -
人类微生物组和缺失遗传力--读论文
缺失遗传力”问题表明,全基因组关联研究中的遗传变异不能完全解释复杂性状的遗传力。传统上,表型的遗传力是通过对双胞胎、兄弟姐妹和其他近亲的家族研究来衡量的,并假设他们之间的遗传相似性。当将该遗传力与通过GWAS获得的相同性状的遗传力进行比较时,两个测量值之间出现了很大差距,全基因组研究报告的值明显较小。已经提出了这种“缺失遗传力”的几种机制,如表观遗传学、上位性和测序深度。然而,它们都不能完全解释这种遗传力差距。...原创 2022-08-06 10:00:20 · 737 阅读 · 0 评论 -
遗传力缺失的案例
在研究人员寻找遗传性的过程中,有一种挥之不去的担忧:常见疾病实际上可能并不常见。医学试图把一系列复杂的症状混为一谈,称之为疾病。但是,如果数千种罕见的基因变异导致了一种疾病,而基因基础对不同的人可能有根本的不同,这有多普遍呢?这些实际上是不同的疾病吗?GW AS实际上可能被证明如此困难,因为研究人员正在一群可能共享很少(如果有的话)的人中寻找共享的易感基因。然而,如果对遗传学没有更深入的了解,就不可能对它们进行更好的分类。“这可能是罕见的变异,常见的疾病。这对人们来说有点可怕,因为很难找到这些东西。...原创 2022-08-06 09:59:48 · 519 阅读 · 0 评论 -
消失的遗传力--wiki
缺失遗传力”问题,是一个事实,即单个遗传变异不能解释疾病、行为和其他表型的遗传力。这是一个对医学有重大影响的问题,因为一个人对疾病的易感性可能更多地取决于“背景中所有基因的综合效应,而不是前景中的疾病基因”,或者基因的作用可能被严重高估。前景中的疾病基因,应该是个体所具有的分型。背景应该是群体具有的分型。...原创 2022-08-05 19:22:45 · 304 阅读 · 0 评论 -
如何科学预测后代的身高
否者环境的效应为负,那就达不到理论身高了,误差是负的。如果成千上万的亲子身高数据,我们就可以观测到回归的现象,就是高尔顿所观测到的高的父母,后代会低于父母的平均值,低的父母,会高于父母的平均值。对于第二个,这是随机的,但是可以通过基因分型检测出来孟德尔抽样,也就是在孩子小的时候就可以检测出来像父亲还是像母亲,这样身高贡献时可能父母就是不是对半分了,而是父亲的0.6,母亲的0.4,或者反之。这就是遗传力,遗传力越高,说明受遗传的因素越高,遗传力越低,说明受遗传的因素越小,受环境的影响因素越大。......原创 2022-08-04 18:07:08 · 5482 阅读 · 2 评论 -
全同胞家系如何计算遗传力及育种值
全同胞家系,由同父同母所生子女的集合体称为全同胞家系。比如父本是A1,A2,A3,母本是B1,B2,B3,如果A1B1,A2A1*B1,有10个后代,分别是:A1B1_1, A1B1_2……,A1B1_10,那么这10个后代为一个全同胞家系上面共有30个个体,属于3个全同胞家系。...原创 2022-08-04 18:06:20 · 2038 阅读 · 1 评论 -
Error: grouping factors must have > 1 sampled level
报错:Error: grouping factors must have > 1 sampled level报错代码:分析一年多点数据,需要考虑地点和地点内区组,都用混合线性模型的随机因子。这里换为。正确的代码如下:方差组分结果:这样就搞定了!...原创 2022-07-13 19:16:27 · 1437 阅读 · 1 评论 -
统计遗传学:第三章,群体遗传
大家好,我是飞哥。前几天推荐了这本书,可以领取pdf和配套数据代码。这里,我将各个章节介绍一下,总结也是学习的过程。引文部分是原书的谷歌翻译,正文部分是我的理解。第一部分基础,分为六个章节,分别是:今天,介绍第三章的内容,群体遗传学的内容,看一下目录:本章节包括:飞哥笔记:PCA分析、群体结构分析、HWE哈温平衡,连锁不平衡分析LD,这些概念对于理解统计遗传很重要重要飞哥笔记:这与动植物育种类似,经过选择的品种(商品种),比野生群体多样性更差,LD衰减更快飞哥笔记:PCA降维,用前两个或者前三个表示十万原创 2022-07-02 17:54:31 · 1447 阅读 · 0 评论 -
遗传进展系列 | 1. 回归系数 相关系数 遗传力的关系
大家好,我是飞哥。前几天群里有老师问如何计算遗传进展?怎么根据公式计算遗传进展?遗传进展不同的元素是怎么来的?如何手动计算遗传进展?如何使用软件计算遗传进展?我计划写几篇博客总结学习一下:回归系数和相关系数以及遗传力的关系遗传进展不同元素的解释及公式推导如何手动计算遗传进展如何使用软件计算遗传进展如何最大化的加快遗传进展1. 先说育种选择的问题:为何表型选择有效?因为有些性状遗传力高,通过表型选择基因型,选择方向一致,选择准确性原创 2022-02-21 07:48:05 · 1094 阅读 · 0 评论 -
从数量遗传学角度介绍为何结婚要拿彩礼钱
彩礼钱,是结婚时男方给女方的钱。这里有两点:钱男方给女方俗话说:“父挫,挫一个;母挫,挫一窝”,意思是父亲影响子女,是单个影响的,而母亲影响子女,是成窝影响的。因为,从遗传的角度,子女各继承父母一半的遗传物质,但是由于是母亲细胞质(比如线粒体)也携带遗传物质,所以母亲传递给后代的遗传物质要多于父亲。所以,想要改良家族的基因和性格,男性找一个好的女性做配偶,比女性找一个好的男性做配偶,影响要更大。想到这里,忽然感觉结婚时,给女方大量的彩礼,也可以理解了。母亲对后代影响大,不只是从遗传的角度(生)原创 2022-02-13 14:00:08 · 920 阅读 · 1 评论 -
BLUP育种值如何计算准确性
大家好,我是飞哥。育种值的准确性是什么呢?为何要计算育种值的准确性呢?育种值的准确性的大小可以反应育种值计算的准确性如何,如果准确性高,就说明计算育种值时依赖的信息多(比如亲子关系、同胞关系等),结果就可靠。育种值也可以计算可靠性,它是准确性的平方另外,对于不同性状或者不同试验的BLUP值的准确性进行比较时,因为方差组分、标准误、BLUP值都不一样,没有一个标准,可以用准确性(accuracy)这个指标进行比较。数据及结果来源书籍:王金玉, 陈国宏. 《数量遗传与动物育种》. 东南大学出版原创 2022-02-07 20:33:52 · 2950 阅读 · 0 评论 -
模型中AIC和BIC以及loglikelihood的关系
asreml中,用于比较模型的LRT检验,会给出P值,但是这只能表示两个模型达到显著与否,而不能表示哪个模型优秀。常用的参数有AIC,BIC,loglikelihood,本篇介绍一下这几个参数的含义,以及是如何计算的1. AIC的解释赤池信息准则(Akaike Information Criterion,AIC)AIC是衡量统计模型拟合优良性的一种标准,由日本统计学家赤池弘次在1974年提出,它建立在熵的概念上,提供了权衡估计模型复杂度和拟合数据优良性的标准。通常情况下,AIC定义为:AIC=−2原创 2022-01-20 08:47:29 · 9960 阅读 · 1 评论 -
plink计算的PCA为什么和GCTA计算的不一样?
今天度过了求知的一天,求知的快乐就是这么朴实无华且枯燥。今天同事问了我一个问题,为什么plink计算的pca和GCTA计算得不一样?然后就引出的今天的查看说明文档,也证明了是介绍就怕认真二字。我们的发现:1,GCTA的说明文档中,有bug,公式没有写全:最后一个公式还要除以N。给出的2010 NG上有写,但是软件的说明文档中不完整。2,GCTA计算PCA时,中间要构建G矩阵,G矩阵构建的方法有两种:yang # 作者的方法,默认的方法VanRaden #GS中GBLUP构建的G矩阵方法原创 2021-11-24 22:20:16 · 1437 阅读 · 1 评论 -
windows电脑 安装asreml 设置防火墙 network TCP ports 5053 5443
有时候,安装asreml,输入激活码时,会显示联网失败。如果电脑是联网状态,就要考虑设置一下防火墙:1. 打开控制面板点击第一个系统和安全,点击高级设置:2. 设置入站规则和出站规则点击新建规则:选择端口:键入5053,5443,点击下一步:最后取一个名字:同样,设置出站规则。搞定!...原创 2021-07-28 20:47:43 · 541 阅读 · 0 评论 -
育种 | 遗传相关--数据代码演示
一些育种的基本概念,需要看教科书理解一下。这次我读起教科书,用实际数据演示一下如何计算遗传相关及显著性。参考书:Raphael A.Mrode编著,于向春 张豪 主译《线性模型在动物育种值预测中的应用》 第三版陈国宏, 张勤. 动物遗传原理与育种方法[M]. 中国农业出版社, 2009.1. 多性状模型为何更优在育种过程中,经常对多个性状进行选择,这些性状可能有遗传相关。2. 遗传相关的原因3. 如何计算遗传相关及显著性5. show me the code...原创 2021-06-18 21:35:21 · 2223 阅读 · 1 评论 -
亲缘关系推断软件:king
今天是端午节,放假了几天,除了分析一个紧急的项目,基本处于放空状态。没有工作,没有动脑。主要内容是遛娃,吃饭,睡觉。下午回来,放空几天的大脑开始回归,想起自己好久没有发文了,介绍一款亲缘关系推断的软件:king1. 亲缘关系推断重要性育种中,判断亲子关系,判断全同胞半同胞关系非常严重要,基因组时代的到来,也使得利用分子数据进行相关的推断成为可能,今天我们介绍一下如何根据个体的基因组数据,推断个体间的亲缘关系。2. king软件介绍官网:http://people.virginia.edu/~wc.原创 2021-06-14 22:02:34 · 3786 阅读 · 6 评论 -
如何计算环境遗传相关 | 育种中的基因与环境互作
基因与环境互作1. 环境参考:http://www.isbreeding.net/common/UploadFiles/file/teaching/%E6%95%B0%E9%87%8F%E9%81%97%E4%BC%A0%E6%95%99%E5%AD%A62013/Ch7.pdf宏环境Macro-environment环境 (Environment): 环境定义为影响一个基因型表现的一组非遗传因素。非生物因素, 如土壤的物理和化学特性、气候因子(如光照,降雨量和温度)等生物因素, 包含原创 2021-05-10 22:07:22 · 1859 阅读 · 0 评论 -
凡尔赛文 | 育种者枯燥乏味的一天
外出吃饭收完玉米,出去吃个饭就下雨,真不知道洗车的意义何在?无线网卡每天吃肉都烦的要死在基地,每天都吃猪肉,各种方式的吃,多想吃点牛肉,羊肉什么的调节一下!猪育种场,牛羊可能会传播疾病。每年冬天都要去三亚的海边呆上一个月不是去旅游,是去三亚玉米地授粉。凡尔斯范文:“朋友问他怎么突然换了个别墅,他说,之前小区停车场的充电桩不够用,物业又不让装。为了他的特斯拉,他只能换个带私人车库的,必须有私人车库,才能装私人充电桩。哦,他对特斯拉才是真爱。我在旁边翻了白眼。他笑得可开心了,一把抱住原创 2020-11-20 22:01:08 · 373 阅读 · 1 评论 -
遇到bug不要慌,都是小场面。
1. 澄清今天早上准备跑步,看到外面雾蒙蒙的,好像是下雨了。也只是好像下雨了,不一定真下呢,毕竟眼见不一定为实,一定要亲身实践,小马过河才可以。所谓不淋雨不知道雨是真实的,不挨揍不知道铁拳的味道,等到下楼雨滴滴到脸上头上的那一刻,我就怂了,上去,这天还去跑步就是一个铁憨憨!所以,澄清:不是不跑步,而是没有跑步的条件,把怂说成敬业是职场老油条的典型标志,...原创 2020-11-17 12:11:34 · 443 阅读 · 0 评论 -
笔记 GWAS 操作流程6-2:手动计算GWAS分析中的GLM和Logistic模型
1. 名词解释GWAS全基因组关联分析手动计算使用R语言编程GLM模型和Logistic模型,提取Effect和PvalueGLM一般线性模型Logistic主要分析广义线性模型,Y变量是二分类性状6-2这是我的GWAS学习笔记,更新到了6-22. GLM模型...原创 2020-10-15 20:04:01 · 4173 阅读 · 1 评论 -
广义线性混合模型(GLMM)评估抗性性状的遗传参数
0. 飞哥感言这篇文章,主要是介绍了抗性数据,如何利用GLMM模型进行的分析,文中,他将9级分类性状变为了二分类性状,进行分析。分析中用到了加性效应(A矩阵),空间分析(行列信息)。对比了SAS和ASReml,结果基本一致。其实,9分级性状,可以直接使用ASReml进行有序多分类性状分析,用累计Logistic模型分析,也可以考虑系谱数据和空间位置信息。这样效果应该更好。回头找下数据,测试一下。1. 文献Genetic analysis of resistance to Pseudomona原创 2020-10-15 20:03:31 · 4013 阅读 · 1 评论 -
分类变量logistic回归分析--1
1. 二分类logistic回归分析2. 多分类logistic回归分析因变量(y变量)是多分类的,包括无序和有序的。无序的多类别因变量:对应无序多分类logistic回归模型有序的多类别因变量:有序多分类logistic回归模型2.1 无序多分类logistic回归分析2.2 有序多分类logistic回归分析...原创 2020-09-23 22:58:49 · 9107 阅读 · 2 评论 -
R语言计算玉米测交试验的配合力
玉米测交试验骨干系:4个待测系:7个重复:2次观测值:产量计算目的:1 计算待测系的一般配合力(选择最优品系)2 计算待测系和骨干系的特殊配合力(选出最优组合)计算流程1 读取数据2 查看数据结构,转化为因子3 构架模型4 提取配合力结果# 读取数据dat = read.csv("NCII_dat.csv")str(dat)# 转化为因子for(i in 1:5) dat[,i] = as.factor(as.character(dat[,i]))str(dat原创 2020-09-12 10:15:19 · 2356 阅读 · 0 评论 -
一文讲清楚动物模型中的母体效应
母体效应母亲对后代生活环境的影响(泌乳能力,母性等),就是母亲带来的效应。俗话说:“父挫,挫一个;母挫,挫一窝”。因为,母性效应很强大,母亲的影响力要甩父亲几条街。从遗传的角度,想要改良家族的基因和性格,男性找一个好的女性做配偶,比女性找一个好的男性做配偶,影响要更大。想到这里,忽然感觉结婚时,给女方大量的彩礼,也可以理解了。女性对后代影响大,不只是从遗传的角度,还有环境的作用,还有交互的作用,更别提还有线粒体遗传呢!我一直对个体永久环境效应,母体遗传效应,母体永久环境效应傻傻分不清楚,构建模型时原创 2020-09-12 10:13:37 · 1786 阅读 · 0 评论 -
笔记 GWAS 操作流程5-1:根红苗正的GWAS分析软件:GEMMA
1. GEMMA软件介绍这个肯定厉害了,是大家闺秀,是名门望族,是根红苗正的GWAS分析软件。GEMMA名称来源:G: Genome-wideE:EfficientMM:Mixed-modelA:AssociationGEMMAX主要特点:快,话说同样的检测方法,GEMMA跑了3.3小时,而EMMA估计要跑27年???2. GEMMA语法特点相对于plink的语法,GEMMA语法更简练,一个杠,一个字母。比如:表型数据:-p协变量:-c而plink的语法的是两个杠,一原创 2020-06-01 21:51:45 · 7958 阅读 · 1 评论 -
Error in data.table data vv lapply vv functionx eval parse text = x
asrmel4r报错截图:Error in `[.data.table`(data, , `:=`((vv), lapply(vv, function(x) eval(parse(text = x), : Supplied 10023 items to be assigned to 1084 items of column 'ainv'. If you wish to 'recycle'...原创 2020-05-18 18:48:14 · 857 阅读 · 0 评论 -
asreml 4r 报错
报错信息Error in asr_vm(Calf = ainv, data = data) : unused argument (Calf = ainv)In addition: Warning messages:1: In `[.data.table`(data, , `:=`((vv), lapply(vv, function(x) eval(parse(text = x), : ...原创 2020-05-18 18:47:07 · 590 阅读 · 0 评论 -
遗传评估分析之模板文章
1. 参考文献伊犁马体尺性状非遗传因素分析及遗传参数估计[J]. 畜牧兽医学报, 2017(10).2. 试验数据描述研究所用数据取自伊犁某2个规模化养马场及参加伊犁马常态化赛事参赛马匹。数据中的体尺指标包括体高(体长(胸围和管围)4个性状。3. 固定因子划分场性别年龄出生年度4. 数据清洗标准提出错误数据删除3倍标准差数据5. 统计分析5.1 表型数据汇...原创 2020-05-18 18:46:19 · 916 阅读 · 0 评论 -
笔记 | GWAS 操作流程1:下载数据
参考:https://github.com/MareesAT/GWA_tutorial/1. 下载数据和代码在linux环境下,新建一个文件夹,进入后运行下面命令:git clone https://github.com/MareesAT/GWA_tutorial.git下载之后,目录如下:.└── GWA_tutorial ├── 1_QC_GWAS.zip ├...原创 2020-04-05 12:52:42 · 7925 阅读 · 2 评论 -
学习 | 遗传力与田间试验设计
最近清理学习资料,发现了之前收藏的这个PPT,很不错,分享学习一下。原文PPT链接:http://nitro.biosci.arizona.edu/workshops/TWIPB2013/Mod1/Mod1-6.pdf1. PPT题目及作者2. 选择相应育种中选择相应是一个很重要的概念,我们对某些性状进行选择时,要有一定的知识,确保一定的选择相应来保证选择的效率。群体需要有变异,...原创 2020-03-23 20:06:49 · 1033 阅读 · 0 评论 -
如何根据系谱作图?
1. 软件包安装https://github.com/luansheng/visPedigreelibrary(devtools)install_github("luansheng/visPedigree")vispedigree软件包作者,栾老师个人百科:https://baike.baidu.com/item/%E6%A0%BE%E7%94%9F/19399751?fr=al...原创 2020-03-23 19:53:44 · 2226 阅读 · 1 评论 -
学习一个PPT:育种中混线性模型的应用
PPT链接https://cpb-ap-se2.wpmucdn.com/blogs.auckland.ac.nz/dist/1/411/files/2018/12/1_Talk_AASC_Gezan-1qkphat.pdf1. 题目和作者2. 混合线性模型可以做什么?加性,显性,上位性的遗传分析基因与环境互作基因与年份互作性状的遗传相关,表型相关分析空间分析结合系谱的分析...原创 2020-03-23 19:52:29 · 1443 阅读 · 0 评论 -
asreml3r 和 asreml4r 多性状分析代码比较
代码比较:asreml4-r 多性状分析library(asreml)library(learnasreml)data("animalmodel.dat")data("animalmodel.ped")dat = animalmodel.datped = animalmodel.pedainv = ainverse(ped)# # asreml-3r# ainv = as...原创 2020-03-23 19:52:06 · 872 阅读 · 1 评论 -
不完全双列杂交种遗传力的计算方法
不完全双列杂交模型y=Mu+Gca1+Gca2+Sca+e y = Mu + Gca1 + Gca2 + Sca + ey=Mu+Gca1+Gca2+Sca+ey 是观测值Mu是截距Gca1是品本1的一般配合力Gca2 是品种2的一般配合力Sca 是特殊配合力e 是残差方法1Vm = Vf = 1/4 * VaVa = 2*(Vm + Vf)Vd = 4*Vm...原创 2020-03-23 19:51:08 · 2827 阅读 · 0 评论 -
数据分析中转化数据对结果的影响
1. 问题提出在模型假定中,数据需要符合正态分布,在动物模型分析中,如果对数据进行转化,对育种值和方差组分变化的情况,进行测试。2. 示例正常数据library(asreml)library(learnasreml)data("animalmodel.dat")data("animalmodel.ped")dat = animalmodel.datped = animalmod...原创 2019-11-26 07:58:43 · 950 阅读 · 0 评论 -
一道数量遗传学题:如何计算育种值
题目设动物个体效应为随机遗传效应(a),日粮、性别和畜舍为固定环境效应(b),背膘厚的遗传力为0.4,请完成以下工作:1,建立背膘厚的线性模型2,写出模型的一般形式和矩阵形式3,写出混合线性模型方程组的各组分成分4,获得的估计值具有哪些特点5,不同日粮和性别的效应值是多少6,个体育种值是多少,是否和表型值排序一致?说明理由处理思路线性模型已经很清楚:固定因子:日粮,性别...原创 2019-11-08 08:29:47 · 4806 阅读 · 0 评论 -
为什么体型比星座更能影响性格?
1. 体型分为哪几种?这个有很多流派,介绍一下克雷奇米的理论,把体型分为四种:每个体型包括性格特征和易患病症。矮胖型,具有狂躁气质,高血压,高血糖瘦高型,具有分裂气质,精神分裂,自我封闭强壮型,具有黏着气质,冲动,癫痫症发育异常型,抑郁气质,抑郁症换句话说,胖子十有八九逗比沙雕,瘦子抑郁分裂,强壮癫痫症,无论你是哪种体型,总有一款适合你。。。2. 星座是什么鬼?在西方占星学...原创 2019-10-26 21:43:12 · 459 阅读 · 0 评论