介绍
gencore
能够对双端测序的 NGS
数据进行 read
去重,消除文库制备和测序过程中引入的测序错误。
gencore
是用 C++
写的,相比于 Picard
等其他工具,具有更快的速度、更少的内存消耗.
同时,能够处理包含 唯一标识符 unique molecular identifiers(UMI)
的测序数据。
原理
gencore
的原理简单来说就是:
- 首先根据每条
read
的染色体id
,起始位置,以及模板长度末端位置进行分组- 然后,在每个分组内,根据
umi
是否相同进行聚类- 在每个类中,双端测序的
read1
和read2
分开分别进行去重矫正- 去重矫正: 根据碱基出现的频率进行位点矫正,在频率过低时加入了参考基因组对应位置的碱基进行矫正
安装
安装使用该软件