05GATK流程和找变异

29 篇文章 259 订阅 ¥9.90 ¥99.00
本文介绍了使用GATK进行基因组分析的流程,包括数据准备、标记或去除重复序列、碱基质量重校正BQSR、单样本找Germline SNPS和INDELs,以及使用Mutect找Somatic mutations。通过详细的步骤和代码示例,展示了如何处理高通量测序数据,以识别遗传和体细胞变异。
摘要由CSDN通过智能技术生成

05GATK流程和找变异

GATK 集合了一套功能全面的高通量测序数据基因组分析工具包,算是业界的权威,更新的速度非常快。需要注意的是,不同版本的 GATK 在工具应用上会有些许不同。这里我们使用是最新版本 GATK 4.1.4.1(截止2019年12月31日)。

数据准备

前面我们提到了,走GATK流程需要到官网下载很多数据库文件,比如下面这些:

dbsnp_146.hg38.vcf.gz 
dbsnp_146.hg38.vcf.gz.tbi 
Mills_and_1000G_gold_standard.indels.hg38.vcf.gz 
Mills_and_1000G_gold_standard.indels.hg38.vcf.gz.tbi 
Homo_sapiens_assembly38.fasta
Homo_sapiens_assembly38.fasta.gz 
Homo_sapiens_assembly38.fasta.fai 
Homo_sapiens_assembly38.dict 
1000G_phase1.snps.high_confidence.hg38.vcf.gz 
1000G_phase1.snps.high_confidence.hg38.vcf.gz.tbi

有了这些数据之后,我们就可以开始 GATK 的最佳实践流程了ÿ

GATK Mutect2是一种广泛用于检测体细胞突变的工具,以下是其检测流程的简要说明。 首先,Mutect2通过比较肿瘤样本和正常样本的测序数据来区分突变事件。它采用配对样本的测序数据,其中包括Tumor样本和Normal样本,用于检测在Tumor样本中特有的变异。 其次,Mutect2将输入的DNA测序数据首先进行处理和去噪,包括读取比对、质量控制和去除PCR偏差等步骤。然后,它使用GATK提供的基于Bayesian模型的变异检测算法来识别可能的单核苷酸变异(SNVs)和小片段插入/删除突变(indels)。 然后,Mutect2使用多个过滤器来排除假阳性的变异。这些过滤器包括测序深度过滤器、错配率过滤器、基因组运行过滤器等。通过应用这些过滤器,Mutect2可以准确地识别并过滤掉可能是由于技术问题或其他伪变异引起的假阳性。 最后,Mutect2输出一个突变调用文件(VCF),其中包含检测到的变异信息,如变异位置、变异类型、基因型频率、基因型质量评分等。这个VCF文件可以进一步用于变异注释、功能预测和统计分析,从而为研究人员提供更多研究突变现象的细节。 总之,GATK Mutect2是一种高效准确的基于比较正常和肿瘤样本测序数据的突变检测工具,它的检测流程包括数据处理、变异检测和过滤、突变调用等步骤,为研究人员提供了有效分析体细胞突变的工具和结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

正在输入中…………

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值