(How to) Call somatic mutations using GATK4 Mutect2

本文详细介绍了如何利用GATK4 Mutect2进行体细胞突变鉴定,包括原始数据检查、数据修剪、数据预处理、PON构建、污染计算、肿瘤-正常模式下的新过滤策略等关键步骤,旨在提高变异检测的准确性和可靠性。
摘要由CSDN通过智能技术生成

Rawdata

  • 对rawdata的fastq进行fastqc检查,决定是否cut某些位置,对所有数据进行了cut前10bp的操作

Data trimming

fastp --thread=16 -q 20 -l 50 -f 10 -F 10 -i tumor_R1.fastq.gz -o 
tumor_R1_clean.fastq -I tumor_R2.fastq.gz -O tumor_R2_clean.fastq

-l参数对长度低于50的reads进行过滤
-h -j可改变质控结果文件名

  • 质量过滤
    -q, --qualified_quality_phred碱基质量值不小于多少时为合格碱基,默认碱基质量值15,默认碱基质量>=15是合格碱基;
    -u, --unqualified_percent_limit允许不合格碱基的占比为多少时去掉这条read,默认不合格碱基占比>40%时,去掉该read;
  • 整体切除
    -f -F对R1和R1分别cut开端多少bp
    -t -T对R1和R1分别cut尾部多少bp

Prepipline 数据预处理 bwa-bqsr

  • BWA
bwa mem -t 24 -R "@RG\tID:tumor\tSM:tumor\tLB:WES\tPL:Illumina" /data2/references/Homo_sapiens/hg38.genomic.fa /data1/01.projects/USER006/cleandata/tumor_R1_clean.fastq 
/data1/01.projects/USER006/cleandata/tumor_R2_clean.fastq > /data1/01.projects/USER006/mapping/tumor.sam
  • SortSam
samtools view -bS tumor.sam > tumore.bam
samtools sort -@ 5 tumor.bam -o tumor.sorted.bam
samtools index tumor.sorted.bam
    • 1
      点赞
    • 0
      收藏
      觉得还不错? 一键收藏
    • 0
      评论
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值