【无标题】单分子纳米孔测序技术及其应用研究进展

单分子纳米孔测序技术及其应用研究进展

曹影1 , 李伟2 , 褚鑫3 , 吴珂1 , 刘海舟1 

, 刘翟1,4      

摘要:测序技术在通量和成本方面有了较大的改进,以单分子纳米孔测序技术为代表的第三代测序技术更是以其超长读长、实时检测和可以直接检测碱基甲基化修饰等优势在医学及生命科学等领域作出了较大贡献。文中就单分子纳米孔测序技术的原理进行了简要描述,并对其在临床、动物、植物、细菌及病毒等领域的应用和其未来的发展方向进行了讨论。

关键词:纳米孔测序技术    临床研究    动物基因组    植物基因组    细菌基因组    病毒基因组    

Research progress and application of nanopore sequencing technology

Ying Cao1 , Wei Li2 , Xin Chu3 , Ke Wu1 , Haizhou Liu1 , Di Liu1,4      

Abstract: Sequencing technology has been greatly improved in terms of throughput and cost. The single-molecule nanopore DNA sequencing, one of the major branches of the third-generation sequencing technology, has made great contributions in the fields of medicine and life sciences due to its advantages of ultra-long reading length, real-time detection and direct detection of base methylation modification, etc. This article briefly describes the principle of nanopore sequencing technology, and discusses its application in clinical, animal, plant, bacterial and virus fields and its future development direction.

Keywords: nanopore sequencing technology    clinical research    animal genome    plant genome    bacterial genome    viral genome    

系统发育和遗传变异分析是我们认识和研究物种的重要方法,而获得高质量的基因组序列数据是开展相关分析的必要前提。自测序技术出现以来,核苷酸测序技术经历了飞速发展,尤其是以高通量著称的第二代测序技术的出现,更使得其越来越成为一种高效、快速、低成本的研究检测手段,被普遍应用于分子生物学、进化生物学、宏基因组学、医学以及法医学等领域,并取得了大量的成果,极大拓展了对物种的认知[1-7]。然而,由于测序技术自身的限制,第一代测序技术不适合多样本的大规模测序;第二代测序技术也因为读长较短、高GC偏性而在应用上有所局限。

以牛津纳米孔技术公司(Oxford Nanopore Technologies,ONT)的单分子纳米孔测序技术(Single-molecule nanopore DNA sequencing)和太平洋生物科学公司(Pacific Biosciences,PacBio)的单分子实时测序技术(Single molecule real-time sequencing,SMRT)为代表的第三代测序技术,因其集高通量、超长读长和可以直接检测碱基甲基化修饰等优势,越来越多地被应用于基因组装配、表观遗传标记、转录组学及宏基因组学等领域[8-11]。与SMRT技术相比,单分子纳米孔测序技术不仅在读长的长度方面更具优势(单读长可达2 Mb)[12-13],而且其设备体积较小,便于携带,因此在极端条件和实验条件相对落后的疫情地区进行样品的实时检测方面具有明显的优势。文中就单分子纳米孔测序技术的原理及其应用进行概述,并对其存在的不足与未来发展方向进行讨论。

1 测序技术的发展1.1 第一代测序技术的原理及其特点

1977年,化学降解法(Maxam-Gilbert method)[14]和双脱氧链终止法(Chain termination method)[15]的相继出现标志着第一代测序技术的诞生(图 1)。化学降解法涉及到5个各自独立的反应,是直接对目的DNA分子进行处理,使用不同的化学试剂将脱氧核糖核酸(Deoxyribonucleic acid,DNA)分别打碎成不同长度的片段后,通过聚丙烯酰胺凝胶电泳对不同长度的片段进行分离。该操作可以避免合成时造成的错误,但相对双脱氧链终止法较为复杂,逐渐被后者取代。双脱氧链终止法的原理是借助双脱氧核苷三磷酸(Dideoxyribonucleoside triphosphate,ddNTP)和脱氧核糖核苷三磷酸(Deoxy-ribonucleoside triphosphate,dNTP)具有相似结构这一特性,其可以在聚合酶的作用下结合到目的模板上,但因缺少一个羟基而使合成反应终止。在4个独立的反应中分别加入一种独特的ddNTP和4种dNTP,后同样经过聚丙烯酰胺凝胶电泳将不同长度的片段分离,根据末端ddNTP的不同得到DNA分子的碱基片段。双脱氧链终止法是第一代测序技术的主要代表,至今仍在普遍使用;之后出现的商用荧光双脱氧测序技术就是在此基础上的改进。

图 1 测序技术的发展Fig. 1 Development of sequencing technology.

图选项 

第一代测序技术产生的读长(Reads)长度为700–900 bp (表 1),准确率高达99.999%[16],设备运行时间短,适用于通量要求低的快速研究项目;但一个反应仅能得到一条读长,且大规模测序成本依然较高,一般适用于少量样本的小规模测序。

表 1 测序技术特点比较Table 1 Comparison of sequencing technology characteristics

First-generation sequencing technologyNext-generation sequencing technologyThird-generation sequencing technology
Reads length700–900 bp50–500 bp< 2 Mb
AdvantageLong reads; AccurateHigh through; InexpensiveUltra-long reads; High through
DisadvantageLow through; ExpensiveShort reads; Equipment expensivePoor accuracy; Analysis software
GenotypeMajor genotypePopulation characteristics of variation sitesAll genotypes in the population

表选项

1.2 第二代测序技术原理及其特点

第二代测序技术的原理主要为边合成边测序(Sequencing by synthesis,SBS)和连接法测序(Sequencing by Ligation,SBL)。边合成边测序的代表为罗氏旗下的454测序技术和Illumina公司的Solexa测序技术,两者检测重点不同。454测序技术主要通过将合成反应中产生的焦磷酸基团(PPi)转化为可见光信号从而判断反应是否发生,在每轮反应中只会加入一个dNTP,若反应发生,通过光学系统即可获特异的检测峰,峰值的高低和反应中匹配的碱基数成正比;其GS FLX+系统最大的读长可达1 000 bp[17],测序准确性与Sanger测序相当,然而,由于该平台是对产生的焦磷酸进行检测,当序列中存在同聚物时其准确性会受影响[18]。Solexa测序技术是针对dNTP本身进行检测,在每个dNTP上均连接不同颜色的荧光基团和可阻断基团,随着合成反应的进行,通过检测加入dNTP的荧光基团的颜色推断DNA序列的组成,每次延伸反应中4种dNTP的浓度均匀,因此可有效地避免掺入错误[19]。

与边合成边测序的思想不同,连接法测序不通过聚合酶链式反应(Polymerase chain reaction,PCR)以待测序列作为模板链合成新的DNA链,而是利用DNA连接酶将一段寡核苷酸探针连接到模板上进行测序。连接法测序的代表是美国应用生物系统公司(Applied Biosystems lnc.,ABI)的SOLiD测序平台,其主要利用DNA连接酶可以将两条相互匹配的核苷酸序列连接在一起的原理来识别DNA序列中特定位置的核苷酸。通过一段已知的序列与待测序列进行互补,并且已知的两个碱基对应一个荧光信号,随着连接反应的进行测序仪记录荧光染料信号,并断裂连接后的互补序列准备进行第二轮连接,如此反复,每一个位点都会被检测两次,可以显著校正误差[20]。

三种主要的第二代测序平台在建库之初都需要对目的片段进行打断(读长长度较短,Illumina平台为100–300 bp,454平台平均长度也只在500 bp左右),且均需对信号进行放大才能达到检测要求,因此会存在一些丰度较低的序列无法被大量扩增从而造成信息的丢失,且PCR过程中也可能引入错配碱基;与第一代测序技术相比,第二代测序技术通量提高了成千上万倍,且单条序列成本非常低廉,适用于大规模高通量的测序需求,现在仍是科研市场的主力平台。

2 单分子纳米孔测序技术原理及特点

牛津纳米孔科技公司的纳米孔测序平台的核心是一个带有2 048个纳米孔、由专用集成电路控制的测序芯片(Flow cell)。单链DNA分子穿过纳米孔时,由于不同的碱基的形状大小有差异,与孔内环糊精分子发生特异性反应从而引起电阻变化。纳米孔的两侧有一恒定电压,因此可以检测到纳米孔中电流的变化,从而反映出通过纳米孔的DNA分子的碱基排列情况。自2017年以后,该纳米孔测序平台主要使用1D和1D2两种测序策略,其中1D测序原理是:基因组DNA或cDNA分子经接头帮助到达纳米孔附近,在解旋酶的作用下双链DNA分子解开为单链,通过孔道蛋白;传感器检测到不同核苷酸通过所引起的电流变化的差异并将其转换为电信号;最后,根据电信号变化的频谱,应用模式识别算法得到碱基类型[21]。与1D测序策略不同的是,1D2测序策略在建库时会在两条DNA分子上加上一种特殊的接头,使得在读取模板链的同时互补链可以附着到膜上,在第一条链离开纳米孔后不久,互补链就有一定概率接着被测序,两条链的数据相互校正,可以帮助提高测序的准确率。

第三代测序技术在测序过程中不需要通过PCR进行信号放大,因此避免了PCR反应过程中引入的碱基错配;在整个反应中也不涉及酶的催化反应,理论上只要核酸提取步骤可以得到足够长度的序列,测序步骤就可以对其进行检测;此外,由于甲基化等修饰前后的核苷酸所引起的电阻变化是不同的,所以该测序平台可通过对电信号的识别来判断碱基的甲基化修饰情况。因此,单分子纳米孔测序技术具有高通量、超长读长、可以直接检测碱基甲基化修饰和体积较小便于携带等优势,在动物、植物、细菌、病毒等的研究中均具有较为广阔的应用空间。

3 单分子纳米孔测序技术应用3.1 纳米孔测序技术在临床研究中的应用

近年来,第二代测序技术在遗传病的临床研究及诊断中的应用大大提高了致病基因检测的效率和准确性,使人们对自身基因及其功能有了更深入的认识。但由于第二代测序读长较短且受GC含量、基因组重复序列等影响,只能解决部分遗传病基因的检测,在多样性和复杂性疾病致病原因的检出方面作用有限。单分子纳米孔测序技术的读长可达2 Mb,在基因组结构变异、点突变等各种致病原因的检测方面有较大的优势,很好地弥补了一代和二代测序技术的不足。

目前,越来越多的科研及临床工作者致力于将单分子纳米孔测序技术应用到遗传病基因检测中。例如,Roeck等[22]分别用Illumina Solexa和单分子纳米孔测序技术检测了大量阿尔茨海默病患者ABCA7基因的提前终止密码子(Premature termination codon,PTC)突变情况,发现单分子纳米孔技术比第二代测序技术多检测出7个PTC突变,解释了不同程度无义介导的mRNA降解和转录调控影响ABCA7基因的表达,进而影响疾病的严重程度,这一发现可能为阿尔茨海默病的干预性治疗创造机会。此外,Stancu等[23]利用纳米孔测序技术检测病人染色体碎裂重排病,结果显示纳米孔测序技术与Illumina测序技术相比,凭借其超长读长的优势在结构变异检测应用中更胜一筹。

3.2 纳米孔测序技术在动物基因组研究中的应用

近年来越来越丰富的动物基因组研究极大地推动了人们对于物种演化、病虫害防治及濒危动物的保护等方面的认知及研究。Tyson等[24]用ONT科技公司的MinION平台对秀丽隐杆线虫的基因组进行了测序,其组装后的contig N50达1.22 Mb,含有145个重叠群的秀丽隐杆线虫基因组,覆盖了参考基因组的99%,从装配的基因组中鉴定出了乙醛诱导的染色体重排和质粒的插入,并且首次证明MinION测序可用于大于100 Mb基因组的装配以及基因组重排的结构分析。Jansen等[25]使用MinION平台对欧洲鳗鲡的基因组进行了测序,组装后基因组中的片段比之前的草图低两个数量级,极大地提高了组装的准确性。

Bickhart等使用以纳米孔测序为主的方法,对家山羊Capra hircus进行测序,与之前的基因组相比连续性提高约400倍,并且更好地展现了反刍动物中以重复家族和免疫基因复合体为代表的长度超过1 kb的重复结构,利于鉴定后代品种的适应性变异,同时为其他反刍动物的遗传学研究提供参考[26]。Jain等[27]使用MinION报告了人GM12878 Utah/Ceph细胞系基因组的测序和组装,最终产生的数据测序深度为30倍,组装的基因组大小为28.67亿碱基,占参考基因组的85.8%;在使用短读长数据进行校正后,装配精度超过99.8%。可以发现,利用纳米孔测序技术能够完整地组装和定位较大片段的主要组织相容性复合物(MHC)基因座,进一步证实了纳米孔测序技术在基因组重测序方面的应用潜力,为结构变异和部分表观遗传修饰的检测提供了有效的技术手段。

3.3 纳米孔测序技术在植物基因组研究中的应用

自2000年第一个植物基因组拟南芥被破译以来[28],近20年里有300多种植物基因组被相继测序并发布,覆盖了各种粮食、油料、蔬菜、药用及果类作物。植物基因组的大小从几十Mb到一百多Gb不等,其多倍性、高杂合以及多重复区域等问题一直是阻碍人们获得高质量植物基因组序列的主要原因。大部分Illumina测序得到的读长较短,组装的基因组连续性欠佳,454测序技术虽然在读长上较其他第二代测序技术有明显的优势,但是还是远短于单分子纳米孔测序技术产生的读长。发表在Nature Plant上的一篇文章[29]巧妙运用MinION/PromethION结合Bionano光学图谱和Illumina测序平台的测序策略,将白菜型油菜、甘蓝型油菜、裂果蕉基因组组装到contig N50 > 5 Mb,并组装出包含代表全部染色体或染色体臂的scaffolds。同时,研究者还与已经发布的组装数据进行了比较,发现该研究组装得到的contig N50是以前报道的100–450倍;最重要的是,相较于已发布数据组装出的446.8 Mb基因组,该研究组装得到了528.8 Mb大小的基因组,填补了之前研究没有覆盖到的82 Mb的区域。可以发现,在纳米孔准确度还不是特别高的今天,多平台测序结合的策略能在保证基因组测序结果可靠性的同时,为我们带来单一测序手段所无法发现的信息,不仅为基因组测序研究带来重大突破,更为人们进一步改良经济作物提供了可能的生物途径,也必将促进人类健康的研究。

3.4 纳米孔测序技术在细菌基因组研究中的应用

细菌表型的差异不像动物与植物那样明显,因此,通过全基因组序列比较对细菌进行分类至关重要。Quick等[30]于2014年首先使用纳米孔测序技术对大肠杆菌K-12的标准菌株MG1655进行测序;随后Loman等[31]于2015年对Quick测序数据的组装过程进行了优化,证明单分子纳米孔测序技术产生的数据质量足以完整地组装细菌基因组并准确地重建基因顺序和方向。Tanaka等[32]测试了纳米孔测序数据对弧菌科(Vibrionaceae)细菌基因组分类的能力,并比较了弧菌科下属5个种的菌株仅使用纳米孔测序结果进行组装和基于纳米孔测序加Illumina Solexa测序混合组装的结果,通过总体基因组相关性指数和多位点序列分析的比较发现,仅使用纳米孔测序结果进行组装的错误不影响平均核苷酸同一性。Li等则通过提高纳米孔测序读长的长度和准确度来进行基于16S核糖体RNA (16S ribosomal ribonucleic acid,16S rRNA)的细菌分析,得到物种的准确分类以及在0.1%丰度下对物种的鉴定和相对丰度的定量分析[33]。

纳米孔测序的长读长在检测基因组中的重复序列与结构变异等方面也拥有明显优势。Kranz等[34]有机结合了纳米孔测序技术的长读长和Illumina测序高准确度的特点,发现了在野生型菌株中存在而在基因工程改造菌株中尚未发现的1 420 bp长转座子侧翼和含ORF的序列,并成功检测到包括3种已知的基因工程改造在内的7种结构变异。Giordano等[35]使用包括MinION在内的3种测序平台,对酿酒酵母S288C菌株进行了测序并比较了不同软件对基因组的组装效果。在测序深度为31X时,只使用纳米孔测序数据进行组装准确度为98%,而结合Illumina测序数据进行校正时,可使准确度提高到99.98%,该研究证明了纳米孔测序技术在微生物中应用的可能性,为其他微生物基因组相关研究提供了很好的示范作用。

3.5 纳米孔测序技术在病毒基因组研究中的应用

对病毒研究来说,纳米孔测序技术超长的读长使其可以覆盖绝大多数病毒基因组,在病毒相关疫情监测、病毒全基因组测序、病毒的进化与遗传变异等方面的研究拥有显著优势。在几内亚埃博拉疫情爆发期间,Joshua等[36]基于MinION平台轻便便携的特点设计了一整套仅一张普通实验台即可容纳的测序系统,对疫情进行实时基因组监测。即使在当地资源有限的条件下,也可以在接收阳性埃博拉样品后不到24 h产生结果,整个测序过程仅需15–60 min,为疫情的监测提供了一个良好的示范。2019年1月,尼日利亚20个州和联邦首都直辖区拉沙热(Lassa fever)疫情进入紧急状态。英格兰公共卫生署的Kafetzopoulou等[37]利用纳米孔测序技术,通过对36个基因组及120份临床样本进行实时宏基因组测序分析,揭示了拉沙热病毒(LASV)的多样化及其与早期发现的毒株的系统发育相关性,该研究在较短时间内缓解了人们对拉沙热在人际间广泛传播的恐惧,使公共卫生资源得到了合理分配,还进一步指出LASV防治重点是加强社区鼠类控制、环境卫生和食品储存安全,是纳米孔测序技术应用的在疫情诊断中应用的经典案例。

3.6 纳米孔测序技术在RNA直接测序中的应用

不经反转录、无需扩增的RNA直接测序能获得全长的链特异性RNA,无测序偏好性,并同时记录碱基修饰,使我们可以研究原始状态下的RNA病毒基因组的本质。RNA直接测序方法首次被描述[38]以来,已被相继用于流感病毒基因组的直接测序和冠状病毒的研究[1139]。Adrian等在冠状病毒的研究中指出,直接RNA测序具有重建大量全长RNA病毒基因组克隆型的潜力。RNA直接测序还可以对在病毒生命周期中起重要作用的病毒信使核糖核酸(messenger RNA,mRNA)等进行分析,可以识别和量化剪接类型并进行碱基修饰检测,而这些在以往的方法中是无法做到的。

RNA甲基化修饰是表观转录组学的重要组成内容,其受到甲基转移酶、去甲基化酶等的动态调控,与基因表达调控密切相关。在过去的几年中,转录组学领域经历了巨大的发展,主要的限制是缺乏通用的方法在转录组范围内定位RNA修饰。Huanle等[40]借助纳米孔测序平台对RNA进行直接测序,高精度地检测出N6-甲基腺苷(m6A) RNA修饰,准确率达90%。该结果通过直接RNA测序鉴定RNA修饰的概念验证,并为将来探索其他RNA修饰提供借鉴,为研究RNA修饰在其天然RNA环境中的生物学作用开辟了途径。

4 总结与展望

单分子纳米孔测序技术以其特有的优势在临床、动物、植物、微生物及病毒基因组研究中发挥着不可或缺的作用。与第二代测序平台相比,纳米孔测序技术不仅可以实时获取基因组序列,产生的超长读长也使其在全基因组范围内结构变异的检测具有更可靠的结果;而且,它利用电信号的独特的测序原理使其可以检测到4种胞嘧啶的碱基修饰,为表观遗传学研究奠定了基础。与太平洋生物科学公司的RS Ⅱ平台相比,单分子纳米孔测序技术无需DNA聚合酶的链式反应,所以其测序读长不受DNA聚合酶活性的影响。这一特点使其在重测序读长方面更具优势,也为我们获得更大的全长基因组并对其进行研究提供了可能。

然而,较高的错误率仍然是阻碍其应用的关键。目前MinION测序仪的单碱基准确率约85%[41],修正后的一致性序列的准确率约97%[27]。对于动植物这样基因组较大且变异率相对较低的生物来说,增加测序深度可达到一定的纠错效果,对研究结果的影响不是特别大。但是临床检测通常对数据的准确率要求特别严苛,再者,病毒基因组较小且变异率较高,因此错误率造成的影响是不可忽视的。已发表的研究中,多是将病毒“准种”作为一个整体来看待,得到其群体水平的一致性(Consensus)序列,从而对其进行进一步的系统进化方面的分析。对于病毒来说,我们得到的往往是一个高度相关但又不完全相同的动态种群,利用一致性序列来代表这个动态种群的全部信息显然不够准确,因此需要我们借助更高精度的测序方法对群体中非主要基因组进行研究。

从纳米孔测序技术在动物、植物、微生物等多个研究对象的应用中我们可以发现,利用多测序平台对对象进行综合分析是现阶段所用的主要测序手段,并且已经取得了很好的成果[232942]。然而,提高纳米孔测序平台的准确度,使其可以更好为科研工作者服务仍然是我们努力的方向。单分子纳米孔测序技术需要向着更高通量、更高的准确率以及更高的自动化程度方向发展。随着纳米孔测序技术准确率的不断提高,其将在科学研究中发挥越来越重要的作用。

此外,改进现有技术并与其结合从而产生新的技术策略为生物学问题的研究提供新的解决方案是纳米孔测序技术的研究人员以及其他科研人员应该重点关注的领域。目前广受关注的10× Genomics公司的单细胞测序技术的基本思想是改进标签技术,给每个细胞及其遗传物质加上一个标签,从而批量对其进行处理;空间转录组测序技术的基础则是结合冷冻切片和标签技术确定细胞的位置信息,然后借助第二代测序技术对固定位置信息的细胞的转录组信息进行分析,从而为各种生物学问题的研究提供一个新的视角。作为研究人员,我们应考虑自身科研目的和需求,充分利用现有平台间的优势,取长补短,构建适宜的测序方案,从而实现新的科学发现。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值