生信软件32 - 变异位点危害性评估预测工具合集

转换和颠换如发生在基因的蛋白编码区内,根据点突变对和蛋白质翻译产生的影响定性,可以把点突变分为同义突变非同义突变二种。

1. 基本概念

1.1 同义突变(synonymous mutation)

碱基替换不引起氨基酸改变称为同义突变。

1.2 非同义突变(non-synonymous mutation)

碱基替换引起编码氨基酸改变称为非同义突变。

1.2.1 错义突变

碱基替换引起编码氨基酸密码子的改变,编码产生了一种新的氨基酸称为错义突变。错义突变大多发生在密码子的第一位或第二位核苷酸,且发生在第二位和第三位时危害更大。

1.2.2 无义突变

碱基突变引起编码氨基酸密码子替换终止密码子(UAA、UAG和UGA),使肽链合成提前终止,这种的截短的蛋白很可能不具有活性。

蛋白编码区(CDS区)的位点发生非同义突变(即碱基替换引起编码氨基酸的改变),很可能为致病突变,其危害程度与突变发生的位点及改变后氨基酸的理化性质有关,特别是非同义突变发生在决定蛋白功能或结构的CDS区域时产生的危害可能越大,但若突变后氨基酸的理化性质相近,则可能不会产生危害(即可视为良性突变)。

对全外显子(WES)、全基因组测序(WGS)或靶向捕获panel获得的变异位点数据,可使用下列评估工具对非同义突变位点的危害程度进行打分。

2. 危害性评估工具

2.1 非同义突变危害性预测工具 :

经测试,下列工具中FATHMM表现较优。

  1. PolyPhen-2
  2. SIFT
  3. MutationTaster
  4. Mutation Assessor
  5. FATHMM
  6. LRT
  7. PANTHER
  8. PhD-SNP
  9. SNAP
  10. SNPs&GO
  11. MutPred

2.2 保守性评估工具:

  1. GERP++
  2. SiPhy
  3. PhyloP

2.3 综合评估工具 :

综合评估工具中,KGGSeq表现最优;CADD核心为支持向量机算法,DANN采用神经网络算法(更容易捕获非线性关系特征)预测变异位点的危害程度,DANN性能优于CADD。

  1. CADD
  2. PON-P
  3. KGGSeq
  4. CONDEL

2.4 评估工具预测结果说明

D表示有害,T 表示容忍, P表示可能有害,B表示良性。
结果说明

3. ANNOVAR软件注释变异位点的危害性

ANNOVAR可调用dbNSFP数据库数据对变异位点进行打分,目前的最新版本为hg19_dbnsfp47a_interpro

# dbNSFP注释数据下载, 将dbnsfp47a_interpro替换为hg19_dbnsfp42c同样有效
# 使用.pl脚本均为ANNOVAR软件的perl脚本
perl annotate_variation.pl \
-downdb -webfrom annovar \
-buildver hg19 hg19_dbnsfp47a_interpro humandb/


# snp vcf转为avinput格式
perl convert2annovar.pl \
-format vcf4 \
sample.snp.vcf > sample.avinput


# 同时获得所有dnNSFP的注释
perl table_annovar.pl sample.avinput humandb/ 
-protocol dbnsfp47a_interpro \
-operation f -build hg19 -nastring .


# 单个数据库变异位点打分
perl annotate_variation.pl -filter -dbtype ljb23_sift \
-buildver hg19 \
-out sample sample.avinput humandb/

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

生信软件2 - 下游比对数据的统计工具 picard

生信软件3 - mapping比对bam文件质量评估工具 qualimap

生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

生信软件5 - RIdeogram包绘制染色体密度图

生信软件6 - bcftools查找指定区域的变异位点信息

生信软件7 - 多线程并行运行Linux效率工具Parallel

生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计

生信软件9 - 多公共数据库数据下载软件Kingfisher

生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa

生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV

生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )

生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计

生信软件14 - bcftools提取和注释VCF文件关键信息

生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

生信软件16 - 常规探针设计软件mrbait

生信软件17 - 基于fasta文件的捕获探针设计工具catch

生信软件18 - 基于docker部署Web版 Visual Studio Code

生信软件19 - vcftools高级用法技巧合辑

生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑

生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump

生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle

生信软件23 - Samtools和GATK去除PCR重复方法汇总

生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download

生信软件25 - 三代测序数据灵敏比对工具ngmlr

生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2

生信软件27 - 基于python的基因注释数据查询/检索库mygene

生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair

生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik

生信软件30 - 快速单倍型分析工具merlin

生信软件31 - Bcftools操作VCF/BCF文件高级用法合集

更多内容请关注公众号【生信与基因组学】,定期更新生信算法和编程、基因组学、统计学、分子生物学、临床检测和深度学习等内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信与基因组学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值