2019年5月26日,周日,小雨
说明:阅读生信宝典和查阅文章的总结,原文请关注公众号生信宝典,参考的博文都附有链接,仅供参考。
生信宝典
NGS基础——高通量测序原理
本文介绍了测序文库构建原理、链特异性文库构建方式和识别方法、测序簇生成过程、双端测序过程、测序接头产生、PCR duplicate、测序通量选择标准等。原文都是一张张PPT,截图下来之后,附一些自己理解的注释吧
以目前最常用的illumina测序为例,其最基本的原理是利用可逆终止的、荧光标记的dNTP进行边合成边测序
- 第一步,将DNA随机打断为短片段
- 第二步,序列两端添加接头
添加接头的目的是使得片段与flow cell上锚定的寡核苷酸序列相结合,进行下一步的链扩增和测序。那么flow cell是什么呢?它是流动池,就像可以流动各种液体的小池子,以Hiseq2500为例,它有2张flowcell,每张flowcell有8条通道,我们称为8个lane,常规的PE150测序1条lane产生的有效数据在120Gb以上,很少有一个样品需要测这么大的数据量,因此在测序时需要将多个文库样品混在同1条lane中,为了能够把测序数据按样本分离,在构建文库的时候,需要用不同index(标签序列)也有人称为barcode对文库进行标记。
初此之外,接头还包括PE和SE测序的引物,它们是双端测序时所用的两条引物,以及P5和P7,它们是flow cell上的共价连接的接头,可以分别于片段的两条单链结合,使得片段被固定在flow cel