背景
在整理分子标签(unique molecular identifier,UMI)之前,先了解下:
NGS 中潜在的错误来源有哪些?
1. 来源建库过程:文库制备、靶向序列捕获和测序均涉及 DNA 聚合酶以及扩增步骤。这些过程会引入偏差,包括重复、相应的 不均匀扩增以及因聚合酶误差导致的假象,这种误差会引入原始样品中本不存在的序列变化。
2. 仪器系统误差:最常使用的Illumina 测序仪来说,误差率在 ~0.05% 到 ~1% 之间,具体取决于读取长度、所用的碱基识别算法和测定的变异类型 。
01 UMI 是啥?
分子标签(Unique Molecular Indentifier,UMI)是一段随机化或特定的核苷酸短序列,通常设计为完全随机的核苷酸链(如NNNNNN),部分简并核苷酸链(如NNNRNYN, R | Y:可以是ATCG中的一种)或者固定核苷酸链(在模板分子有限的情况下)。
02 UMI 原理
UMI技术的原理是在PCR扩增前给每一条原始DNA加上一段特有的3~8 bp短标签序列,经文库构建及PCR扩增后一起进行测