TASSEL5中利用GLM模型进行GWAS分析

GLM(General Linear Model),指一般线性模型,其直接将基因型X和表型数据Y进行线性拟合,使用计算公式表示为:Y = Xα + Zβ + e。公式各组分含义如下:

y:表型性状;

Xα:群体结构,作为固定效应(Fix Effect);

Zβ:标记效应(Marker Effect);

e:残差。

本文使用TASSEL5软件中GLM模型进行关联分析,使用三个示例文件,基因型文件-mdp_genotype.hmp.txt,群体结构文件-mdp_population_structure.txt和表型文件(mdp_traits.txt)。以开花期为例,使用的GLM统计模型为:

开花期=群体结构+标记效应+残差

使用TASSEL5分析流程如下:

一、基因型文件过滤

主要包括删除单态性位点和低频率的位点。选择基因型文件mdp_genotype,点击Filter-Sites选项;设置Minimum Frequency为0.05,Maximum Frequency为1.0,Minimum Count为150;勾选Removeminor SNP states选项,单击Filter产生过滤后的基因型文件。

二、选择性状

选择表型文件mdp_traits.txt,点击Filter-Traits选项,只对开花期dpoll进行选择。

点击OK,产生开花期的表型文件。

三、协变量的选择

群体结构是每个群体的比例输出,本案例包含Q1+Q2+Q3三个群体,将其全部作为协变量会产生线性相依关系,GLM模型可以正确处理这种相依性,而MLM(混合线性模型)则不适用于这种选择。因此,本文使用三个群体作为协变量进行GLM关联分析。

四、数据的合并

按住Ctrl键,同时选择过滤后的基因型文件、开花期表型文件以及群体结构文件,点击Data-Intersect Join选项,产生合并后的文件。

五、GLM关联分析

选择合并后的文件,点击Analysis-GLM选项进行关联分析。

可设置Run Permutations为1000,产生分析后的结果文件。

六、关联分析结果可视化

1、曼哈顿图可视化

选择关联分析后的结果文件,点击Results-Manhattan Plot选项,即产生曼哈顿图。

2、QQ图可视化

选择关联分析后的结果文件,点击Results-QQ Plot选项,即产生QQ图。

也可以输出关联分析结果文件,使用其他软件进行可视化。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉香GG

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值