gatk过滤_GATK使用方法详解(变异检测)

本文详细解析了GATK变异检测中如何解释Variation,包括CHROM、POS、ID、REF、ALT、QUAL、FILTER、INFO、FORMAT和样本基因型等关键信息。介绍了基因型质量值(GQ)、碱基深度(DP和AD)以及基因型概率(PL)的计算方法和意义,帮助理解GATK变异报告。
摘要由CSDN通过智能技术生成

3. 怎么解释Variation

CHROM 和 POS:代表参考序列名和variant的位置;如果是INDEL的话,位置是INDEL的第一个碱基位置。

ID:variant的ID。比如在dbSNP中有该SNP的id,则会在此行给出;若没有,则用’."表示其为一个novel

variant。

REF 和 ALT:参考序列的碱基 和 Variant的碱基。

QUAL:Phred格式(Phred_scaled)的质量值,表

示在该位点存在variant的可能性;该值越高,则variant的可能性越大;计算方法:Phred值 = -10 * log

(1-p) p为variant存在的概率;

通过计算公式可以看出值为10的表示错误概率为0.1,该位点为variant的概率为90%。

FILTER:使用上一个QUAL值来进行过滤的话,是不够的。GATK能使用其它的方法来进行过滤,过滤结果中通过则该值为”PASS”;若variant不可靠,则该项不为”PASS”或”.”。

INFO:这一行是variant的详细信息,内容很多,以下再具体详述。

FORMAT 和

NA12878:这两行合起来提供了’NA12878′这个sample的基因型的信息。’NA12878′代表这该名称的样品,是由BAM文件中的@RG下的

SM 标签决定的。

4. 基因型信息

chr1

873762 . T G [CLIPPED] GT:AD:DP:GQ:PL 0/1:173,141:282:99:2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值