ANNOVAR注释

1. 下载

1.下载需要科研机构邮箱
#http://download.openbioinformatics.org/annovar_download_form.php

tar xvfz annovar.latest.tar.gz

下载Aannovar的数据库list

#下载hg38版本的list
perl annotate_variation.pl -downdb avdblist -buildver hg38 -webfrom annovar path/to/humandb

里面是可以通过annovar直接下载的数据库
在这里插入图片描述

2.下载数据库

#refGene
perl ../annotate_variation.pl -downdb -buildver hg38 -webfrom annovar refGene ../humandb
#knownGene
perl ../annotate_variation.pl -downdb -buildver hg38 -webfrom annovar knownGene ../humandb
#esp6500siv2_all(only all)
perl ../annotate_variation.pl -downdb esp6500siv2_all -buildver hg38 -webfrom annovar ../humandb
#exac03
perl ../annotate_variation.pl -downdb exac03 -build hg38 -webfrom annovar ../humandb
#cosmic70
perl ../annotate_variation.pl -downdb cosmic70 -buildver hg38 -webfrom annovar ../humandb
#nci60
perl ../annotate_variation.pl -downdb nci60 -buildver hg38 -webfrom annovar ../humandb
#dgvMerged
perl ../annotate_variation.pl -downdb dgvMerged -buildver hg38 ../humandb

#avSNP
perl ../annotate_variation.pl -downdb avsnp144 -buildver hg38 -webfrom annovar ../humandb
#1000g2015aug
perl ../annotate_variation.pl -downdb 1000g2015aug -buildver hg38 -webfrom annovar ../humandb

#dbnsfp30a(SIFT, PolyPhen2, LRT, MutationTaster, MutationAssesor, FATHMM; GERP++, PhyloP, SiPhy)
perl ../annotate_variation.pl -downdb dbnsfp30a -buildver hg38 -webfrom annovar ../humandb

#clinvar_20160302
perl ../annotate_variation.pl -downdb clinvar_20160302 -build hg38 -webfrom annovar ../humandb

#dann
perl ../annotate_variation.pl -downdb dann -buildver hg38 -webfrom annovar ../humandb

处理精简一些数据库

awk -F "\t" '{print $1"\t"$3"\t"$5"\t"$6"\t0\t"$2}' humandb/hg38_wgEncodeGencodeBasicV23.txt >humandb/hg38_Gencode.txt
awk -F "\t" '{print $1"\t"$3"\t"$5"\t"$6"\t0\t"$13}' humandb/hg38_refGene.txt >humandb/hg38_refGeneName.txt

rmsk.gff 数据库,相关信息参考
https://blog.csdn.net/tanzuozhev/article/details/80958785

echo "##gff-version 3" >humandb/hg38_rmsk.gff
awk -F "\t" '{id++;print $6"\thg38_rmsk\texon\t"$7"\t"$8"\t"$2"\t"$10"\t.\tID=\""id":"$11"("$12")\"; repName=\""$11"\"; repClass=\""$12"\""}' humandb/hg38_rmsk.txt >>humandb/hg38_rmsk.gff

从UCSC下载
hg38版本:http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/
hg19版本:添加链接描述

wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/wgEncodeGencodeBasicV23.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/cytoBand.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/wgRna.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/genomicSuperDups.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/gwasCatalog.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/rmsk.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/dgvMerged.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/cpgIslandExt.txt.gz

#OMIM
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/omimAv.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/omim2gene.txt.gz

3.注释脚本

-protocol : 注释的数据库
-buildver: 基因组版本
-nastring:空位置用 . 填充
--otherinfo: 输入文件中第5例后面的info信息也进行输出
--operation:数据库的类型,需要与前面的-protocol顺序严格对应,且逗号分割。g为基因注释类型 ,r为区域注释类型,f为过滤注释类型
--gff3dbfile:注释使用的 gff 文件
–vcfinput:输入为vcf格式的文件,输出也为vcf格式
–vcfformat:vcf文件的格式

perl table_annovar.pl input.vcf path/to/humandb -buildver hg38 -otherinfo -nastring . -protocol GeneName,refGene,Gencode,cytoBand,wgRna,genomicSuperDups,gff3,avsnp150,cosmic70,clinvar_20180603,gwasCatalog,1000g2015aug_eas,1000g2015aug_sas,1000g2015aug_eur,1000g2015aug_afr,1000g2015aug_amr,1000g2015aug_all,esp6500siv2_all,exac03,dbnsfp33aneed,gerp++gt2,caddgt10 --operation r,g,r,r,r,r,r,f,f,f,r,f,f,f,f,f,f,f,f,f,f,f --gff3dbfile hg38_rmsk.gff --vcfinput --argument '--colsWanted 5,--transcript_function,--colsWanted 5,,,,,,,,,,,,,,,,,,,' --outfile out_put_annovar_file

4. 不同数据库匹配的规则:

annotate_variation.pl 中表明了已经设定的数据库的匹配位置,输出第几列信息,不在预设内的(else),按照第 2,3,4列匹配,输出第5列。
在这里插入图片描述
在这里插入图片描述

5. Annoovar注释的3种形式

1.Gene-based Annotation(基于基因的注释)
基于基因的注释(gene-based annotation)揭示variant与已知基因直接的关系以及对其产生的功能性影响,需要使用for gene-based的数据库。

2.Region-based Annotation(基于区域的注释)
对位于数据库区域的位点进行注释,不关注具体的位点是否一致,变异是否一致。揭示位点与基因组特定区域的关系,例如:它是否落在已知的保守基因组区域。

在这里插入图片描述
3.Filter-based Annotation(基于过滤的注释)
这种注释方式需要变异位点的位置以及碱基变化精确匹配。
在这里插入图片描述

注释脚本

perl /Apps/annovar/convert2annovar.pl -includeinfo -allsample -withfreq -format vcf4 raw.somatic.foxog_filtered.vcf > raw.somatic_converted_avinput.xls

perl /Apps/annovar/table_annovar.pl raw.somatic_converted_avinput.xls .//annovar/humandb -buildver hg19 -otherinfo -remove -outfile outdir -protocol refGene,snp142,popfreq_all_20150413,gnomad_exome,cosmic88,clinvar_20190821,ljb26_all,intervar_20170202 -operation g,f,f,f,f,f,f,f -argument -hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs

splicing剪接位点:指DNA在转录时发生RNA拼接的位点。
在vcf中 在splicing位点附件发生的突变,所处区域显示为 splicing,表示这个突变位点在一个splicing附近。 在碱基变化列 c.894-1G>A 表示 在转录本894位置是一个剪接位点,在 -1 位置上,也就是893位置发生了G>A突变。

如果想扩大剪接位点两侧突变检测范围 , 在-argument 参数后边对应 refGene数据库的位置 添加-splicing_threshold 10 , 如: -argument '-splicing_threshold 10 -hgvs' 引号内表示对refGene 数据库进行 -splicing_threshold 10-hgvs 两个处理,所以用引号引起来。

在这里插入图片描述

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
annovar是一种常用的基因组注释工具,可以将人类基因组变异数据与已知注释信息比对,从而确定变异的功能影响和可能的疾病关联。annovar注释图像化指的是将annovar注释的结果以图像的形式呈现出来,方便用户快速理解和分析。 首先,在注释结果中可以提取出各类变异的详细信息,如SNV(单核苷酸变异)、InDel(插入缺失)、CNV(拷贝数变异)等,这些信息可以用柱状图或饼图等图像形式展示,直观地显示各类变异的比例和趋势。 其次,annovar注释结果中还包括注释的基因名称、功能类别、基因本体论(GO)和通路分析等。可以使用网络图或热图等方法将这些注释结果进行可视化展示,以便于用户理解和分析。例如,可以使用网络图形式显示基因间的相互关系和连接,帮助用户了解基因之间的功能调控网络;可以采用热图形式展示不同功能类别或通路中基因的表达情况,帮助用户找到与特定变异相关的生物学过程或通路。 此外,annovar还可以根据注释结果提取可能的疾病关联信息,如OMIM(人类遗传疾病目录)号、GWAS(全基因组关联研究)相关性等。这些疾病关联信息可以以雷达图或散点图等形式展示,帮助用户快速发现与人类疾病相关的变异。 综上所述,annovar注释图像化可以通过柱状图、饼图、网络图、热图、雷达图等形式将注释结果可视化展示,帮助用户直观地理解和分析变异对基因功能和疾病关联的影响。这样的图像化呈现方式可以更好地辅助研究人员在大规模基因组数据中找到感兴趣的变异和潜在疾病相关基因,为后续进一步的生物学研究提供有力支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

风风是超人

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值