文件怎么进行注释_【生信小课堂】利用snpEff注释vcf并提取不同注释成分的子vcf...

一般我们在进行群体重测序分析的时候,会对vcf文件进行注释,并提取出不同的注释成分,看看他们的核酸多态性(θpi),Tajima’s D之类的参数进行计算,看看在编码区跟非编码区这些参数有什么区别。

本文测试文件请自行下载snpEff,里面的example就可以进行测试

本次小课堂内容就是教会大家最简单的处理方法:首先我们需要准备的内容有几个,第一个是注释软件snpEff

https://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip/download​sourceforge.net

第二个是参考基因组跟注释文件,模式物种的可以直接下载,自己测的基因组的,就需要自己构建数据库了,构建数据库的方法也非常简单

首先,在下载完的snpEff文件夹里面建立一个文件夹,我愿称之为data(好吧,他只能叫data)

f5935202a123da4d6da9d4013037d950.png
linux的就是mkdir data

接着,在data文件夹里面创建两个文件夹,一个名字叫genomes,里面放着基因组,然后再创建一个文件夹,文件夹命名为参考基因组名字的前缀,里面放着gtf文件,命名为genes.gtf或者是gff尾缀

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值