tassel软件使用linux,【技术干货】动植物GWAS经典软件TASSEL的使用

本文介绍了动植物基因组关联分析软件TASSEL的使用,包括数据质控、群体结构分析、亲缘关系计算、关联分析和结果展示。通过TASSEL进行GLM和MLM/CMLM模型的关联分析,并提供了相关软件的下载链接和操作建议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原标题:【技术干货】动植物GWAS经典软件TASSEL的使用

做功能基因定位的生物狗基本都知道,经过10来年的发展,关联分析与连锁分析一样,已经成为一项基本工具,广泛应用于动植物功能基因挖掘中。在动植物(尤其是植物)的关联分析中,TASSEL软件是最早出现的开源软件,相对于其他软件,TASSEL也是使用的最广泛的,您想不想知道在您有了表型、基因型之后,怎么使用TASSEL进行关联分析呢?往下看吧

24335f3ee01b623977a24e06a7b32cec.png

,小编教你啊~

d12d470206a9ba55c0ae4b3f7d7c2b0b.png

先给软件的下载地址 http://www.maizegenetics.net/tassel

在拿到表型和基因型(我们以vcf为例)后,完成GWAS分析,你只需要5步。

第一步 数据质控

内容包括:

1)按分型百分比条件过滤,多数文章剔除缺失率在20%以上的位点,样本量较大的群体中,可以将缺失率小于50%的位点都保留;

2)按等位基因频率过滤,通常去除最小(或第二)等位基因频率小于5%的位点,样本量较大的群体中,可以降低到1%;

3)多等位位点的过滤(当软件无法接受时);

4)有时候还会去除缺失数据太多的样本(基因型缺失比例大于20%或更高);

5)哈迪温伯格平衡过滤,一般在无法使用较为复杂的统计模型的情况下使用,如人类的Case/Control GWAS中一般将不符合哈迪温伯格平衡的位点过滤掉,动植物GWAS中一般不过滤;

6)表型极端值去除,用Excel从小到大排一下序看看就知道了。

如果你熟悉plink软件(https://www.cog-genomics.org/plink2),那么第1)到第5)点就变得非常easy了,一条命令行即可以搞定:

./plink --vcf ./test.vcf --maf 0.05 --geno 0.2 --mind 0.2 --hwe 0.001 --biallelic-only --recode vcf-iid --out test.bia.maf0.05.int0.8.ind0.8.hwe0.001 --allow-extra-chr

--vcf 表示输入的文件为vcf文件

--maf 控制第二等位基因频率的,我们这里设置为不小于5%

--geno 控制位点基因型的缺失比例的,我们这里设置为20%,即缺失比例大于20%的位点都会过滤掉

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值