在回答文章标题问题之前,我们需要先了解一个现象,index-hopping,即标签跳跃或者错配。下图就是一种index-hopping产生的过程:
上述图片展示的就是一种可能导致数据错误分配的情况,其前提是1号样品的index组合在2号样品中也可能出现。
实际上illumina后续HiSeq4000,NovaSeq6000机器在测序桥式PCR过程中,如果有建库残留的index扩增引物,也可能产生index hopping现象。
大致了解了什么是标签跳跃现象之后,我们再来解释一下什么是UDI接头。所谓UDI接头(Unique Dual Index),是指双端唯一index序列的接头。使用UDI接头可以大幅度降低illumina测序过程中因为机器测序或者实验过程中引入的交叉污染,从而尽可能避免测序数据“张冠李戴”的现象。
下图即是UDI接头避免错误的原理。
备注:图片来自网络。
也许您已经看明白了,并非UDI接头可以防止交叉,而是发生序列交叉了之后,可以丢弃这部分数据。大白话说就是,虽然浪费了一点数据,但是