Fastq2VCF传统流程

本文详细介绍了从Fastq序列数据到VCF变异文件的处理流程,包括序列质量控制、比对映射、SNV和indel呼叫、突变位点评分、数据库注释等内容。使用了bwa、Samtools、GATK、ANNOVAR等工具,旨在提高变异检测的准确性和灵敏度。同时,文章提及Fastq2vcf自动化工具,简化了整个流程。
摘要由CSDN通过智能技术生成

1620

1.序列QC:

去除低质量reads,和连续的低质量片段,去掉接头序列。QC统计reads数量及测序质量。

2.Mapping:

由于bwa能准确,快速的将短序列比对到基因组上,而且软件持续更新和说明文档完备,是外显子捕获测序的首选。

3.Sam到bam转换:

Samtools 的多种工具可以将sam文件转换为bam文件,rmdup工具能去除PCR扩增产生的冗余reads,消除由于文库扩增而导入的突变,降低假阳性。

Flagstat统计reads的mapping情况以及比较去除duplicate前后reads数目的反映样品建库的冗余情况。

Picard提供的多个工具,修改bam文件,是之适合于后续的GATK软件包中的工具的处理。

4.Indel区域的reads重新做局部多序列比对:

在indel的边缘,一些错配看起来很像是SNP,通过对dbSNP库及bam文件检测到的indel附近的reads进行局部的重新比对,可以消除indel周边的假阳性SNP。

5.碱基质量重新打分:

测序仪给reads中的碱基的qual值存在一定的偏差,通过经验的错误模型来重新计算的碱基的qual值,重新给reads的各个碱基的qual打分。

6.Call snv和indel:

对处理好的多样品bam文件同时运行UnifiedGenotyper&#

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值