gatk过滤_GATK使用方法详解(相关参数和参考文件说明)

本文详细介绍了GATK的VariantRecalibrator和ApplyRecalibration参数,包括-badLodCutoff、-maxNumTrainingData等,并提供了资源数据的选择指南及hard filter的 VariantFiltration工具使用方法。此外,还解释了VCF文件格式及其内容。
摘要由CSDN通过智能技术生成

VariantRecalibrator参数详解VariantRecalibrator

-badLodCutoff 当LOD得分低于这个值的时候,就用于构建高斯混合模型的bad variants。默认值是-5。

-maxNumTrainingData 构建高斯模型过程中,用于训练的最大位点数目。如果超过这个数目,将被随机删除。默认值是2500000。

-minNumBad 构建高斯模型的bad variants时的最少低质量值得位点数。

-recalFile 用于ApplyRecalibration的输出文件。

-resource 已知的变异信息。

-rscriptFile 结果中生成图片的脚本。

-tranchesFile 用于ApplyRecalibration的tranche结果输出文件。

-tranche 设置tranche阈值。

-an 选择填加注释信息。

更多其他参数参考:

http://www.broadinstitute.org/gatk/gatkdocs/org_broadinstitute_sting_gatk_walkers_variantrecalibration_VariantRecalibrator.html

ApplyRecalibration参数详解ApplyRecalibration

-ef 输出结果中不显示被过滤掉的位点。

-lodCutoff VQSLOD值低于这个值就过滤掉。

-recalFile 上一步生成的recalFile。

-tranchesFile 上一步生成的tranchesFile。

-ts_filter_level 上一步中确定的tranche值。

更多其他参数请参考: http://www.broadinstitute.org/gatk/gatkdocs/

GATK4(Genome Analysis Toolkit version 4)并不是GATK(Genome Analysis Toolkit version 3)的简单升级,而是完全重构的一个新一代工具集。它采用了更现代的架构和设计理念,提供了一套更高效、模块化和用户友好的接口。 对于SNP(Single Nucleotide Polymorphism)过滤GATK4通常使用`VariantFiltration`工具来进行。在GATK4中,你需要首先对变异数据(如VCF文件)进行初步质量控制(QC),这包括检查诸如低覆盖区域、错误率等指标。以下是基本步骤: 1. **加载数据**:使用`SelectVariants`选择感兴趣的样本和/或特定位置的数据。 ``` SelectVariants -R reference.fasta -V input.vcf.gz -L target_regions.bed -O qc_input.vcf ``` 2. **运行预过滤**:应用一些内置的过滤规则,比如最低质量分数(QScore)、覆盖度等。 ``` VariantFiltration -R reference.fasta -V qc_input.vcf -filterName "LowQD" --filterExpression "QD < 2.0" --filterLevel "PASS" -O initial_filter.vcf ``` 3. **自定义过滤**:如果需要,可以编写自定义过滤条件,并添加到`VariantAnnotator`或创建新的过滤规则。 ``` AnnotateVariants -R reference.fasta -V initial_filter.vcf --alwaysAppendAnnotation --annotation QD,FS ... -O annotated.vcf VariantFiltration -R reference.fasta -V annotated.vcf ... --filterExpression "FS > 60.0" -O final_filtered.vcf ``` 4. **检查结果**:最后查看最终的filtered.vcf文件,确认SNPs是否满足你的过滤标准。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值