第三代DNA测序及其相关生物信息学技术发展概况
摘 要:本文介绍了第三代DNA测序的技术原理及应用现状,并对相关的生物信息学技术进行了综述。第三代测序技术以单分子测序为主要特点,目前已广泛应用于食品科学及生命科学研究的各个领域,其代表有Heliscope Bio Science公司的SMS技术、
- 【题 名】第三代DNA测序及其相关生物信息学技术发展概况
- 【作 者】杨悦 杜欣军 梁彬 郭季冬 程晓真 王硕
- 【机 构】天津科技大学食品营养与安全重点实验室 天津300457
- 【刊 名】《食品研究与开发》2015年 第10期 143-148页 共6页
- 【关键词】基因组学 第三代DNA测序技术 生物信息学 数据库
- 【文 摘】本文介绍了第三代DNA测序的技术原理及应用现状,并对相关的生物信息学技术进行了综述。第三代测序技术以单分子测序为主要特点,目前已广泛应用于食品科学及生命科学研究的各个领域,其代表有Heliscope Bio Science公司的SMS技术、Pacific Bio Sciences公司的SMRT技术等。本文同时归纳总结了基因组学相关的生物信息学发展状况及常用的数据库
- Abstract:
- In the present study, the principles and applications of the third generation of DNA sequencing
technology were summerized, as well as the progresses of bioinformatics involved genome sequencing. The third
generation DNA sequencing technology was characterized by single DNA molecular and had been used in many
fields of food science and life science research, for instance, SMS from Heliscope BioScience and SMRT from
Pacific BioSciences. Meanwhile, the developement of bioinformatics and the main bioinformatics databases were
summarized in the paper.
Key words:genomics; the third DNA sequencing technology; bioinformatics; database
1986 年美国科学家Thomas Roderick 首次提出基因组学的概念,基因组学包括核苷酸测序及序列分析、基因定位、基因功能分析等内容[1]。基因组学始于人类基因组图谱绘制和测序的提出,这一伟大的理想在2004 年完成,使基因组学成为生命科学领域中最重要和最基础的研究领域之一[2],如今也广泛于食品科学、环境科学等众多研究领域。基因组学的迅速发展离不开DNA 测序技术与生物数据处理手段-生物信息学。从上世纪六、七十年代开始,由最初的人工DNA 测序到现在的第三代测序技术-单分子实时测序技术,DNA 测序技术经历了翻天覆地的变化,同时,DNA 测序获得的大量数据促进了生物信息学的产生和发展,利用生物信息学的方法分析和处理序列数据对认识和揭示基因组序列中蕴含的信息至关重要。
本文旨在阐述第三代DNA 测序技术的技术原理及应用情况,同时介绍了与之相关的生物信息学的研究内容及一些常用的数据库,为基因组测序及后续分析工作提供参考。
1 第三代测序技术
目前正在兴起的第三代测序是单分子测序[3-6],这种技术无需PCR 扩增,这种方法测序通量更高,操作过程更简单,成本更低。另外它还具有3 个显著的特点:第一,单分子测序技术可以直接对RNA 进行序列,这样大幅度降低体外逆转录产生的系统误差;第二,可以直接检测甲基化的DNA 序列,为表观遗传学研究
奠定了基础;第三,可以对特定序列的SNP 进行检测,实现对稀有突变及其频率的测定。目前市面上单分子测序平台有Heliscope BioScience 公司的SMS(truesingle molecular sequencing)技术[7-8],Pacific BioSciences公司的SMRT(single molecule real-time)技术[9],VisiGenBiotechnologies 公司的FRET (fluorescence resonanceenergy transfer)技术[10]以及Oxford Nanopore Nechnologies公司的纳米孔技术[11]。
1.1 SMS 测序平台
SMS 技术仍然建立在合成测序的基础之上,只是检测方法更加灵敏。它是利用电场的作用以采集与聚
合酶结合的标记核苷酸的荧光特征进行测序[12]。其原理如图1 所示[13]。
(1)将待测的DNA 序列随机打断并在3' 末端加上polyA,利用末端转移酶进行荧光标记和阻断,阻断的目的是防止在测序过程中核苷酸在模板的3' 末端进行延伸;
(2)将这些标记好的小片段与带有polyT 引物的平板杂交并精确定位;
(3)逐一加入A、C、G、T4种荧光修饰的dNTP 及聚合酶,当碱基互补延伸后,利用全内反射显微镜(total internal reflection microscopy,TIRM)进行单色成像,之后切开荧光染料和抑制基团,洗涤,加帽,允许下一个核苷酸的掺入;
(4)如此反复循环,就可以实现实时测序采集荧光信号获得碱基信
息。数十个循环后,将测得的DNA 序列拼接,即得到完整的基因序列,目前已有所应用[14-15]。SMS 测序技术的
优点是:文库制备简单,不需要PCR 扩增或连接酶,尤其适合RNA 直接测序,无需传统的cDNA 合成步骤,从而避免了体外逆转录产生的错误;缺点是初始读长较短,仅有35 bp,准确率较低,同时单分子测序成本较高,阻碍着这项技术的推广应用。
1.2 SMRT 测序平台
SMRT 测序技术的单分子荧光检测设备采用零模
式波导技术,以SMRT 芯片为载体进行测序反应,其原
理如图2 所示[16-17]。
测序的大致流程如下:
(1)将待测的DNA 样品随机打断,制成液滴后将其分散到SMRT 芯片中;
(2)MRT 芯片是包含成千上万的纳米孔(Zero -ModeWaveguides,ZMWs)的金属片,这些纳米孔的直径短