一、初现庐山真面目
一代测序:又称Sanger测序(多分子,单克隆)
历史:第一代DNA测序技术(又称Sanger测序)在1975年,由Sanger等人开创,并在1977年完成第一个基因组序列(噬菌体X174),全长5375个碱基。研究人员经过30年的实践并对技术及测序策略的不断改进(如使用了不同策略的作图法、鸟枪法),2001年完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。
原理:在4个DNA合成反应体系(含dNTP)中分别加入一定比例带有标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列。由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应。
二、江山辈有人才出
二代测序:NGS技术(多分子,多克隆)
背景:Sanger测序虽读长较长、准确性高,但其测序成本高通量低等缺点,使得de novo测序、转录组测序等应用难以普及。经过数据不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa,Hiseq技术,ABI公司的Solid技术为标记的第二代测序技术诞生,后起之秀Thermo Fisher的Ion Torrent技术近年来也杀入历史舞台。
1、Illumina 原理:
桥式PCR+4色荧光可逆终止+激光扫描成像
主要步骤:
①DNA文库制备——超声打断加接头
②Flowcell——吸附流动DNA片段
③桥式PCR扩增与变性——放大信号
④测序——测序碱基转化为光学信号
优势劣势:Illumina的这种测序技术每次只添加一个dNTP的特点能够很好的地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换。而读长短(200bp-500bp)也让其应用有所局限。
2、Roche 454
油包水PCR + 4种dNTP车轮大战 + 检测焦磷酸水解发光
主要步骤:
①DNA文库制备——喷雾打断加接头
②乳液PCR——注水入油独立PCR
③焦磷酸测序——磁珠入孔,焦磷酸信号转化为光学信号
优势劣势:454技术优势测序读长较长,平均可达400bp,缺点是无法准确测量类似于PolyA的情况时,测序反应会一次加入多个T,可能导致结果不准确。也正是由于这一原因,454技术会在测序过程中引入插入和缺失的测序错误。
3、Ion Torrent 原理
油包水PCR + 4种dNTP车轮大战 + 微电极PH检测
主要步骤:
①DNA文库制备——喷雾打断加接头
②乳液PCR——注水入油独立PCR
③微电极pH检测——磁珠入池记录pH
优势劣势:Ion Torrent与454相比,主要差异在测序中,Ion Torrent不需要昂贵的物理成像设备,成本相对较低体积较小,同时操作更为简单,整个上机测序可在2-3.5小时内完成(文库构建时间除外)。其劣势在于芯片的通量并不高,非常适合小基因组和外显子验证的测序。
小结:二代测序相比一代测序大幅降低了成本,保持了较高准确性,并且大幅降低了测序时间,将一个人类基因组从3年降为1周以内,但在序列读长方面比起第一代测序技术则要短很多,这也给三代测序提供了发展空间。
三、独辟蹊径补空缺
三代测序:单分子测序
背景:测序技术经过第一代、第二代的发展,读长从一代测序的近1000bp,降到了二代测序的几百bp,通量和速度大幅提升,那么第三代测序的发展思路在于保持二代测序的速度和通量优势同时,弥补其读长较短的劣势。三代测序与前两代相比,最大的特点就是单分子测序,测序过程无需进行PCR扩增。
1、Oxford nanopore
纳米孔 + 电流检测技术
原理:该技术设计了一种特殊的纳米孔,孔内共价结合有分子接头,最终得到电信号而不是光信号或pH信号的测序技术。当DNA碱基通过纳米孔时,电荷将发生变化,因而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),灵敏的电子设备检测到这些变化从而鉴定所通过的碱基。
优势劣势:
①读长很长,大约在几十kb,甚至100 kb;
②错误率目前相比较高,且是随机错误,而不是聚集在读取的两端;
③数据可实时读取;
④通量很高(30x人类基因组有望在一天内完成);
⑤起始DNA在测序过程中不被破坏;
⑥样品制备简单又便宜;
⑦可直接测序RNA。
2、PacBio SMRT
纳米孔 + 荧光可逆终止dNTP技术
原理:PacBio SMRT技术其实是应用了边合成边测序的思想(使用4色荧光标记 4 种碱基),其超长读长的关键在于使用了活性持久且高保真的DNA聚合酶,并以SMRT芯片为测序载体(ZMW原理)。
优势劣势:
①SMRT技术的测序速度很快,每秒约10个dNTP;
②错误率较高,达到15%,出错随机,可通过多次测序来进行有效的纠错(如使用Sparc对30X的数据进行分析,错误率可达到0.5%);
③原始DNA不被破坏;
④读长可达10kbp。
3、Helicos Heliscope
单分子荧光可逆终止技术
原理:该技术基于边合成边测序的思想,将DNA随机打断成小片段分别进行dNTP荧光标记,经过不断地重复合成、洗脱、成像、淬灭过程完成测序。
主要步骤:
①制备:DNA打断加polyA+Cy3
②测序:dNTP荧光可逆终止
特点:
①读取长度约为30-35 bp,每个循环的数据产出量为21-28 Gb;在测序完成前,各小片段的测序进度不同;
②可根据同聚物的合成会导致荧光信号的减弱这一特点来推测同聚物的长度;
③可通过二次测序来提高准确度(直接变形洗脱模板)
小结:
三代测序优势:
①第三代基因测序读长较长,可以减少拼接成本,节省内存和计算时间;
②作用原理上避免了 PCR 扩增引入错误;
③拓展应用:RNA的序列,甲基化的DNA序列等;
三代测序缺陷:
①单读长的错误率偏高,需重复测序以纠错(增加测序成本);
②依赖DNA聚合酶的活性;
③成本较高(二代Illumina的测序成本是每100万个碱基0.05-0.15美元,三代测序成本是每100万个碱基0.33-1.00美元)。
④生信分析软件不够丰富、数据积累少。
来源:元码基因