GATK4 最佳实践-生殖细胞突变的检测与识别

本文详细介绍了使用GATK4进行生殖细胞突变分析的流程,包括HaplotyperCaller生成GVCF,ImportGenomicsDB合并GVCF,GenotypeGVCFs进行基因型确定,以及VariantRecalibrator进行变异质控等步骤,适用于全基因组及目标区域测序数据的处理。
摘要由CSDN通过智能技术生成

欢迎关注"生信修炼手册"!

GATK4 对于体细胞突变和生殖细胞突变的检测分别给出了对应的pipeline:

  1. Germline SNPs+Indels

  2. Somatic SNVs + Indels

本篇主要关注生殖细胞突变的分析流程Germline SNPs+Indels。示意图如下:

图中红色方框部分的从Analysis-Ready Bam 到,主要包括以下4步

  1. HaplotyperCaller in GVCF mode

  2. ImportGenomicsDB Consolidate GVCFs

  3. GenotypeGVCFs

  4. Filter Variants by Variabt Recalibration

官网给出了6套用于参考的pipeline

主要分析步骤都差不多,这里我选择第4个通用的流程 ,网址如下

https://github.com/gatk-workflows/gatk4-germline-snps-indels

1.  HaplotyperCaller in GVCF mode

对于每个样本,采用HaplotyperCaller计算突变位点,命令如下

gatk --java-options "-Xmx6G -XX:GCTimeLimit=50 -XX:GCHeapFreeLimit=10" \
    HaplotypeCaller \
    -R ${ref_fasta} \
    -I ${input_bam} \
    -L ${interval_list} \
    -O ${output_filename} \
    -contamination 0 -ERC GVCF

ref_fasta代表参考基因组的fasta文件;input_bam代表预处理阶段产生的 bam文件;interval代表interval list文件,如果指定这个参数,只会输出指定区域的突变信息。对于全基因组测序,不需要这个参数,对于外显子和目的区域捕获测序, 则需要这个参数;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值