SOLiD测序原理及实验流程

SOLiD测序原理及实验流程


SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的reference序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。

1. SOLiD文库构建

使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。简单地说,制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。


2 油包水PCR

我们知道,文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面 (SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。

油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。ABI公司提供的SOLiD实验手册已经把小水滴体积及水相中DNA模板和磁珠的个数比等重要参数进行了技术优化和流程固定,尽可能提高“优质小水滴”(水滴中只含一个DNA模板一个P1磁珠)的数量,为后续SOLiD测序提供只含有一种DNA模板扩增产物的高质量P1磁珠。


3. 含DNA模板P1磁珠的固定

SOLiD测序反应在SOLiD玻片表面进行。含有DNA模板的P1磁珠共价结合在SOLiD玻片表面。磁珠是SOLiD测序的最小单元。每个磁珠SOLiD测序后形成一条序列。


4. SOLiD双碱基编码原理及测序流程

SOLiD“双碱基编码原理”实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关系。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。如图1“底物探针”所示,探针5’末端可分别标记“CY5,Texas Red,CY3,6-FAMTM”4种颜色的荧光染料,并且这四种颜色用数字“3,2,1,0”示意;探针3’端1~5位为随机碱基,可以是“A,T,C,G”四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,“双碱基编码矩阵”规定了该编码区16种碱基对和4种探针颜色的对应关系,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基,由上可知,SOLiD连接反应底物中共有45 种底物探针。

单向SOLiD测序包括五轮测序反应。每轮测序反应含有多次连接反应(一般情况下,片段文库是7次,mate-paired文库是5次,所以片段文库共有35个连接反应,而末端配对文库共有25次连接反应)。每轮测序反应的第一次连接反应由与P1引物区域互补的“连接引物”介导。这五种连接引物长度相同,但在P1引物区域的位置相差一个碱基(分别用n,n-1,n-2,n-3,n-4表示),都含有5’端磷酸,所以可以介导连接反应的进行。现以图5所示一个磁珠上发生的SOLiD测序反应为例进行说明。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA模板(也就是每个磁珠表面的单链DNA模板序列都是一样的),所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录反应模板序列第1、2位碱基序列的探针第1、2位编码区颜色信息,随后的化学处理断裂探针3’端第5、6位碱基间的化学键,并除去6~8位碱基及5’末端荧光基团,暴露探针第5位碱基5’磷酸,为下一次连接反应作准备。由此我们知道第一次连接反应使合成链多了5个碱基,所以第二次连接反应得到反应模板序列第6、7位碱基序列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息… … 以此类推,第一轮测序反应获取了模板链7个碱基对的颜色信息。如图5所示,由于第二轮连接引物n-1比第一轮错开一位,所以第二轮得到是以0,1位起始的7个碱基对的颜色信息。五轮测序反应反应后,按照第0、1位,第1、2位... …的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3”组成的SOLiD原始颜色序列。

 

5. 数据分析原理

SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列(图6.a)。理论上来说,按照“双碱基编码矩阵”(图4),只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的兼并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基(图6.1)。

和所有其它测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。为避免“连锁解码错误”的发生,SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基序列转换成颜色编码序列,然后与SOLiD原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”(图6)。由于每个碱基都被独立地检测两次(图5),且SNP位点将改变连续的两个颜色编码(图6.2),所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
高通量测序的代码和操作流程会因为使用的测序平台、数据分析软件和具体分析要求而有所不同。下面是一些常用的高通量测序代码和操作流程,仅供参考: 1. Illumina 测序 Illumina 是目前使用最广泛的高通量测序平台之一。其操作流程大致如下: 1. DNA 或 RNA 样品制备:样品可以是血液、组织、细胞等。首先需要提取 DNA 或 RNA,并进行纯化和定量。 2. 文库构建:将 DNA 或 RNA 样品片段化,并用连接器连接到载体上,构建文库。 3. PCR 扩增:使用 PCR 扩增文库中的 DNA 片段,使其扩增到足够的数量,以便进行测序。 4. Illumina 测序:将 PCR 扩增的文库中的 DNA 片段进行测序,可以使用 Illumina 的 HiSeq、MiSeq、NovaSeq测序仪器。 5. 数据分析:对测序得到的原始数据进行质量控制、序列比对、变异检测、基因表达分析等数据分析步骤,可以使用软件包括 BWA、Samtools、GATK、DESeq2 等。 2. PacBio 测序 PacBio 是一种单分子实时测序技术,可以得到长读长序列。其操作流程大致如下: 1. DNA 样品制备:首先需要提取 DNA,并进行纯化和定量。 2. 文库构建:将 DNA 样品分子化,并用连接器连接到载体上,构建文库。 3. PacBio 测序:将文库中的 DNA 分子进行测序,可以使用 PacBio 的 RS II、Sequel 等测序仪器。 4. 数据分析:对测序得到的原始数据进行质量控制、序列比对、变异检测等数据分析步骤,可以使用软件包括 SMRT Analysis、Canu、Quiver 等。 3. Oxford Nanopore 测序 Oxford Nanopore 是一种基于纳米孔技术的高通量测序技术。其操作流程大致如下: 1. DNA 或 RNA 样品制备:样品可以是血液、组织、细胞等。首先需要提取 DNA 或 RNA,并进行纯化和定量。 2. 文库构建:将 DNA 或 RNA 样品分子化,并用连接器连接到载体上,构建文库。 3. Nanopore 测序:将文库中的 DNA 或 RNA 分子通过纳米孔进行测序,可以使用 Oxford Nanopore 的 MinION、PromethION 等测序仪器。 4. 数据分析:对测序得到的原始数据进行质量控制、序列比对、变异检测等数据分析步骤,可以使用软件包括 Guppy、Minimap2、Medaka 等。 需要注意的是,上述流程仅是高通量测序的基本流程,具体操作和代码可能因为实验设计、数据分析需求等因素而有所不同。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值