PacBio和NanoPore两种三代测序仪的比较

可以这么说,目前在长度长的三代测序领域内,基本上是PacBio和Nanopore的天下。二者测序技术各有千秋,我就来谈一点浅薄的认识。

首先,介绍一下二者的测序原理。
PacBio采用SMRT测序技术,名称取自single molecule real time sequencing,即单分子实时测序。
在这里插入图片描述

上图为PacBio的核心测序原理,基本上包括以下几个要点:

  1. 制造出一个ZMW孔(Zero-Mode Waveguides),一个光学物理概念。大白话说,就是在这个孔底部照射激光,这些光不会穿透小孔。这样每个孔不同颜色的光互相不会干扰。
  2. 四种不同的碱基,经过修饰荧光基团,在ZMW孔内,进行聚合反应的时候,荧光基团脱落。在激光的照射下,显示不同的颜色。从而可以根据颜色的变化顺序,推导DNA序列。
  3. 构建环装文库。任何高通量测序,都必须告诉机器从哪里开始测序。这个就要靠文库构建来解决。PacBio的文库结构如下图所示:
    在这里插入图片描述

接下来,我介绍一下,nanopore的测序原理。
Nanopore也是有一个很小的纳米孔,不过这个孔略有区别。如下图所示:
在这里插入图片描述

这个孔是一个天然的蛋白,孔径很小,仅能通过单链DNA分子。其测序原理通俗解释,就是想办法让单链DNA通过这个纳米孔。但是,纳米孔两侧有一个记录电压变化的传感器。在施加一个电压的时候,单链DNA的不同碱基通过纳米孔的时候,电压的变化情况是不一样的。传感器就是记录这些不一样的电压变化,从而将电信号转化为碱基信息。

同样,为了测序,nanopore测序仪也是要建库的,其文库构建过程如下图:
在这里插入图片描述

备注:Nanopore文库两侧是添加了Y字形接头的,不同于Illumina的Y字形文库,该文库携带了一个马达蛋白(具有解旋功能,将双链DNA解开变成单链,并通过纳米孔)。

介绍完了两个平台的基本原理,我来聊聊两个平台的技术特点吧。

  1. PacBio可以引入CCS测序模式,即不断的滚环测序,对一个DNA分子的正反链不断测序,可以提高但碱基精度。
    在这里插入图片描述

  2. NanoPore可以做的比较小巧,且由于其测序不需要进行合成反应,不需要添加一些修饰的碱基,所以使用相对方便。不需要花费太多经费采购仪器。且由于测序仪器可以很小巧,甚至可以在野外进行测序。

  3. 至于读长和测序精度,实测数据来看,应该不分伯仲吧。

  4. 两台机器都可以直接读取甲基化信息。

  5. 但是,两台机器对于连续相同的碱基,读取容易出错。

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要用三代测序数据组装出染色体级别的基因组,可以按照以下步骤进行: 1. 数据预处理:对三代测序数据进行质量控制和过滤,去除低质量和含有适配器的reads。 2. 组装:使用基因组组装软件对经过预处理的数据进行组装。由于三代测序数据具有较长的read长度和较高的错误率,因此需要使用适合处理这种数据的组装算法,如Flye、Canu、wtdbg2等。 3. 内部一致性校正:对组装结果进行内部一致性校正,去除矛盾的序列,提高组装准确性。 4. 粘连区域处理:在染色体级别组装过程中,常常会出现粘连区域,即存在多个不同的序列可以组装在一起。可以使用长读比对、Hi-C数据等方法进行粘连区域的处理,得到最终的染色体级别组装结果。 5. 评估和改进:对组装结果进行评估和改进,比较组装结果和已知参考基因组的差异,并使用其他数据如RNA-seq数据进行验证和改进。 以上是组装染色体级别基因组的一般步骤,具体实施中还需要结合具体的数据情况和组装软件的特点进行调整和优化。 ### 回答2: 染色体级别的基因组组装需要经过以下几个步骤: 1. 数据质控:首先对三代测序数据进行质控,包括去除低质量碱基、修剪末端序列、去除接头序列等处理,确保数据的准确性和完整性。 2. 参考基因组比对:使用相关物种的参考基因组作为参考,将测序reads与参考基因组进行比对。此步骤可使用一些开源的比对工具,如Bowtie、BWA等。 3. 去重和拼接:根据比对结果,对重复的读取进行去重,然后将比对上的reads进行拼接,生成更长的序列。常用的拼接工具有SPAdes、SOAPdenovo等。 4. 错误矫正:对拼接得到的长序列进行错误矫正,去除可能存在的测序错误。可使用Quiver、LoRDEC等工具进行错误矫正。 5. 碱基错误矫正:使用相关物种的其他基因组信息,如原核生物的拓扑结构、转录本序列等,进行碱基错误矫正,提高结果的准确性。可使用Pilon、Racon等工具进行碱基错误矫正。 6. 持续迭代:以上步骤可能需要多次迭代进行,直至获得较完整且准确的染色体级别基因组。 7. 结果评估:通过与已知基因组的比对、基因预测和注释等方式对组装结果进行评估,验证基因组的准确性和完整性。 总之,染色体级别基因组组装利用三代测序数据,通过质控、比对、拼接、错误矫正等多个步骤,最终得到较完整、准确的基因组序列。然而,组装结果仍需综合其他实验验证,才能确保基因组的完整性和准确性。 ### 回答3: 要组装一个染色体级别的基因组,首先需要收集足够的三代测序数据。三代测序技术包括Illumina,PacBioNanopore等,它们提供了高质量、长读长的测序数据。 第一步是建立一个参考基因组序列。可以使用辅助测序技术,如BioNano或Hi-C,来获得染色体的全长信息。这些信息将帮助将测序数据映射到参考基因组上。 接下来,将三代测序数据与参考序列进行比对。根据每个数据集之间的重叠区域,可以通过重叠改正和序列拼接方法将读取连接起来。通过比对多个数据集,可以提高准确性并填充序列间的空隙。 然后,进行读取错误矫正。三代测序技术由于其相对较高的错误率,可能需要采取矫正措施。可以使用PacBioNanopore提供的高质量排序读取来矫正Illumina数据集中的错误。 在得到组装的序列后,需要通过重叠区域检测和破碎区域映射来验证和填充序列。通过比对之前得到的长读取和映射的链接信息,可以检测到重叠和破碎区域,并进行修复和连接。 最后,继续进行序列校准和错误修复。可以使用基于概率的方法,如polish read or consensus correction,来矫正残留的序列错误。 通过这些步骤,我们可以逐渐组装出一个染色体级别的基因组。但需要明确的是,基因组组装是一个复杂的过程,可能涉及到很多细节和步骤。因此,在实际实施中,可能需要借助各种基因组组装软件和技术来完成任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值