Sentieon持续为业界提供高性能的NGS数据分析软件。在数据处理模块之外,Sentieon软件套装中还包含了多个用于BAM和VCF文件的质控模块。相比于常规的GATK/Picard工具,Sentieon的质控工具利用Sentieon引擎对于BAM文件进行高速读取,可以大幅度提升分析速度,缩短全流程的耗时。
BAM深度统计工具加速
下面我们以常用的BAM深度统计工具“CoverageMetrics”为例,做个具体介绍。
CoverageMetrics工具匹配了GATK的“DepthOfCoverage”工具,以BAM文件为输入,可以统计出某个位置、某个区间、某个基因或者全局的测序深度数据,同时也可以将全局数据通过平均值、中位数、四分位或者超过某个深度阈值的比例等形式进行输出展示。 比如在统计全基因组数据质量时常用的“xx%区域的覆盖深度超过15x”这样的指标,就可以由这个质控模块给出。如下图所示,与开源软件对比,”CoverageMetrics”模块的提速在10-80倍之间。
Sentieon与GATK QC参数对照表
目前Sentieon软件包中的QC质控模块,以及对应的开源工具列举如下:
建议Sentieon用户对照这张表格,将目前流程中的质控模块都尽可能替换成Sentieon工具,获得最大的分析速度与计算成本的收益。
具体使用方法:https://support.sentieon.com/manual/usages/general/#coveragemetrics-algorithm
Sentieon中文网站:https://www.insvast.com/sentieon