一、DNA 基因 基因测序
脱氧核糖核酸(DNA)是生物细胞内携带有合成RNA和蛋白质所必需的遗传信息的一种核酸,是生物体发育和正常运作必不可少的生物大分子。脱氧核糖核苷酸由磷酸基团、脱氧核糖和碱基 3 部分组成,其中磷酸基团和脱氧核糖亝交替连接组成 DNA 骨架结构,碱基排列顺序((A、T、G、C))则是 DNA 携带遗传信息的基本形式,构成了遗传密码。碱基戒脱氧核糖核苷酸数量是衡量 DNA 长度的标准,即由 1000 个脱氧核糖核苷酸组成的DNA 的长度为 1Kb。细胞携带的一套完整单倍体 DNA 即基因组,人类基因组的大小为 3Gb 左史。
DNA中遗传信息可以在细胞核内RNA聚合酶的作用下通过转录过程形成mRNA,mRNA从细胞核穿出来到细胞质,在核糖体(分为三个区域E、P、A)作用下,由可以配对的tRNA(3个碱基)将氨基酸带过来,逐步合成多肽链,在内质网、高尔基体等修饰下形成蛋白质。
基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。基因有两个特点:一是能忠实地复制自己,以保持生物的基本特征;二是在繁衍后代上,基因能够“突变”和变异,当受精卵或母体受到环境或遗传的影响,后代的基因组会发生有害缺陷或突变。绝大多数产生疾病,在特定的环境下有的会发生遗传。也称遗传病。在正常的条件下,生命会在遗传的基础上发生变异,这些变异是正常的变异。
基因测序是指通过测序设备对从样品中提取的脱氧核糖核酸(DNA)的碱基排列顺序(A T G C 的排列顺序)进行测定,从而解读 DNA 的遗传密码,为生命科学研究、临床诊断和治疗等提供指导的过程。
测序流程
基因组测序大致可分成 6 个步骤:DNA 提取、DNA 片段化、DNA 文库构建、DNA 扩增、 测序、测序结果分析。
DNA 提取:通过生物化学方法,分离纯化细胞中的DNA。
DNA 片段化:由于DNA 非常长,如人类的DNA 平均长度在 100Mb 左右,不方便直接测序,因此通常把一条DNA打断成若干长度 1Kb 以内的DNA 片段。这也使人们能同时对多 DNA 片段进行操作,加快测序速度。
DNA 文库构建:片段化的DNA 仍不能直接进行测序,还需要经过特殊处理。为了配合后续测序步骤,通常做法是在每个 DNA 片段两端加上人工设计合成的特定 DNA 短片段。此外,为了长期保存和方便使用,一般把这些改造后的DNA 片段构建成 DNA 文库。
DNA 扩增:从细胞中提取的DNA 非常少,因此在正式测序之前需要对 DNA 进行扩增,成千上万倍地放大 DNA数量。目前主要是聚合酶链式反应(PCR)。
测序:测序系统对扩增后的DNA 进行测序。
测序结果分析:生物信息学方法对测序数据进行处理是测序过程中极其关键的环节。
二、测序技术
第一代测序技术
桑格测序法是第一代测序技术的典型代表,是基于 DNA 聚合酶的 DNA 合成反应,因此也称为酶测序法或者双脱氧测序法。核苷酸是DNA合成基本原料。人们对核苷酸迚行改造,使它们具有特殊功能:(1)用 4 种荧先基团分删标记 4 种核苷酸,从而仪器能通过荧先基因检测核苷酸种类;(2)改造的核苷酸一旦参与DNA合成就会终止DNA继续合成,将少量改造核苷酸掺入正常反应体系中,最终会产生长短不一DNA 片段。基于这个原理,桑格测序法可分为 DNA合成和电泳检测两大步骤,对完成DNA合成反应的样品迚行毛 细管电泳,利用激光自动读取仪读取测序结果,转换成DNA碱基序列。
第二代测序
1、可逆链终止测序法原理
大致可分为DNA 扩增、测序、测序结果分析 3 个步骤。
桥连 PCR 扩增 DNA:在芯片表面附着许多测序用的引物,被测序的 DNA 能与这些引物特异性地结合,从而被固定到芯片上,再通过 PCR 反应,大量增加 DNA 的数量。
可逆链终止法测序:通过4种特殊修饰的核苷酸来实现。与第一代测序相似,A、 T、C、G 这 4 种核苷酸分别带上不同荧光基团标记,能够被识删和区分。同时,它们的结合能使 DNA 合成暂停。通过激先照射,这些核苷酸的化学结构发生改发,荧先基团被切除,不再具有中断 DNA 合成得特性,使 DNA 合成能继续进行。简单地说,测序的过程是“核苷酸掺入DNA新链合成”、“洗脱多余核苷酸”、“激先照射读取信号”三个步骤不断循环。
测序结果分析:对于某一条固定在芯片上的DNA 片段,每进一个循环的测序反应,DNA 片段所在位置对应的探头就能读取一个荧先信号。随着测序反应的进行,将得到一系列的信号, 再把这些荧光信号对应回相应的核苷酸,即得到DNA片段的碱基序列。然后把每个位置的DNA 片段的序列进行拼接,就能还原出原始 DNA的完整序列。但由于在 DNA 扩增阶段,并非DNA 文库中所有的DNA 都能顺利结合到芯片上,因此实际操作中通常会进行多次测序反应,再把各次测序结果进行汇总拼接,提高DNA文库的覆盖度。
第三代测序
三、测序产业链
Illumina 一家独大
测序数据处理和分析的技术壁垒较高,是该环节最重要的部分,是掣肘基因测序行业 中游发展的关键因素,也是各大测序公司的核心竞争力所在。目前测序数据处理癿流程基本标准化,但对数据处理过程中的核心步骤各家公司都有自己的一套分析斱法,即使是相同的原始数据,不同算法对细节得处理不尽相同,输出得结果也不同。
四、商业化应用
科研服务应用
生育健康诊断应用
肿瘤基因检测应用
消费级基因测序
【文章来源】基因谷 Life的时光列车
【全文整理】奥咨达
【声明】部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与我们联系,我们将迅速采取适当措施。
热点推荐多家中国企业在列,美国发布最新呼吸机及配件EUA清单
你需要了解的FDA审厂细则,FDA最新审厂指南
可点击标题阅读原文
你点的每个在看,我都认真当成了喜欢