GATK4最佳实践-体细胞突变的检测与识别

欢迎关注"生信修炼手册"!

分析体细胞突变时,通常采用tumor_vs_nomal 的实验设计。在检测时,由于同时会检测出生殖细胞突变和体细胞突变,需要做的就是去除生殖细胞突变位点,那么剩下的就是体细胞突变位点了,GATK4 采用Mutect2 检测体细胞突变,分析流程如下:

1. 根据normal 样本得到 panel of normal

首先对每个normal 样本,运行Mutect2

gatk Mutect2 \
   -R reference.fa \
   -I normal1.bam \
   -tumor normal1_sample_name \
   --germline-resource af-only-gnomad.vcf.gz \
   -O normal1_for_pon.vcf.gz

然后使用CreateSomaticPanelOfNormals命令创建panel of normal

gatk CreateSomaticPanelOfNormals \
   -vcfs normal1_for_pon_vcf.gz \
   -vcfs normal2_for_pon_vcf.gz \
   -vcfs normal3_for_pon_vcf.gz \
   -O pon.vcf.gz
2. normal_vs_turmor 得到体细胞突变

命令如下:

gatk Mutect2 \
   -R reference.fa \
   -I tumor.bam \
   -tumor tumor_sample_name \
   -I normal.bam \
   -normal normal_sample_name \
   --germline-resource af-only-gnomad.vcf.gz \
   --af-of-alleles-not-in-resource 0.00003125 \
   --panel-of-normals pon.vcf.gz \
   -O somatic.vcf.gz

mutect2检测时,是成对检测的,需要一个normal bam 和 turmor bam, germline-resource指定一个生殖细胞突变的vcf文件,这里选择的是gnomAD数据库 ,链接如下

http://gnomad.broadinstitute.org

这个数据库收集了大量外显子和全基因组测序的SNP calling结果。af-of-alleles-not-in-resource指定germline-resource 变异位点的频率,低于该频率的位点认为是一个不可靠的生殖细胞突变位点。panel-of-normals指定第一步生成的pon.vcf.gz文件。

3. 过滤VCF文件

第一步,运行GetPileupSummaries

gatk-launch GetPileupSummaries \
   -I tumor.bam \
   -V small_exac_common_3.vcf \
   -O pileups.table

第二步,运行CalculateContamination

gatk-launch  CalculateContamination \
   -I pileups.table \
   -O contamination.table

第三步,运行FilterMutectCalls

gatk FilterMutectCalls \
   -V somatic.vcf.gz \
   -contamination-table contamination.table \
   -O filtere

扫描关注微信号,更多精彩内容等着你!

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值