【变异位点功能注释annovar】实操一:如何构架库文件

1. 下载基因组文件:fa/ fna      gff3/ gff(2种格式都可以构建)

来源:NCBI 

wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/016/699/485/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna.gz
wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/016/699/485/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.gff.gz

解压:

gunzip GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna.gz
gunzip GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.gff.gz

注意:如果染色体不是以数字表示,注释之前就需要替换染色体,否则后面注释出来也乱,非数字染色体

来源:NCBI 可以查找对应的数字与编号

2. gff 3 /gtf  转化为txt

/annovar/gff3ToGenePred ref/chicken/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.gff GRCg7b_refGene.txt


/annovar/gtfToGenePred ref/chicken/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.gtf GRCg7b_refGene.txt

3.  转换fa

 perl software/annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile  /mnt/data/ref/chicken/GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna  GRCg7b_refGene.txt --outfile GRCg7b_refGeneMrna.fa

4.开始注释

见后续

ANNOVAR 注释|自建数据库 - 简书

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值