初识BioNano图谱技术

最近看文献,发现有的文章在组装过程中同时依赖了BioNano图谱和Hi-C技术来进行辅助组装,学习一下BioNano技术。

BioNano图谱也好,Hi-C也好,都是用来将Scaffold来锚定到染色体上,辅助组装。那么先回顾一下在这两个技术之前所用的方法。

1、传统锚定方法

传统的染色体锚定方法有基于物理图谱和遗传图谱的两种方式,前者主要是通过序列的重叠关系来确定Scaffolds在染色体上的位置信息,后者主要是利用减数分裂时期的姐妹染色单体联会后的重组率来判断Scaffolds在染色体的排序和方向。在实际操作过程中,传统的锚定方法存在实验难度大、成本高和实验误差大等问题。

2、基于染色质构象捕获技术的锚定方法

Hi-C技术的基本原理如下:首先对处于生命状态的细胞使用交联剂将染色质固定,最常使用的交联剂是甲醛;接着利用限制性内切酶如Hind III酶切消化被固定的染色质;随后使用生物素标记的核苷酸填充黏性末端;在稀释环境中进行平末端填平反应,以促进交联的染色质片段之间的连接;随后使用超声波对捕获DNA片段进行打断处理,最后将被生物素标记的DNA片段通过Illumina平台进行测序,得到全基因组染色质互作矩阵。将得到的DNA序列比对到参考基因组上,如果一对序列对应于不同位置的酶切片段,那么就认为这两个片段之间有一次染色质互作,从而能够构建基因组中所有酶切片段之间互作频率矩阵。

Hi-C技术产生的染色质互作呈现出随着距离增加而衰减的规律,也就是说染色体内部的相互作用强于染色体之间的相互作用,同一染色体上距离较近的互作强于距离较远的互作。正是基于这一规律,Hi-C技术可以用来锚定Scaffolds,同时可以指导Scaffolds在染色体上的排序和定向。参考Hi-C测序及测序数据特征

3、基于光学谱图技术的锚定方法

光学图谱技术最早由Schwartz等(1993)发明,近期BioNano Genomics公司推出的Irys光学图谱系统,才真正使光学图谱技术得到商业化应用(Lam et al.,2021)。Irys系统利用特定的限制性内切酶和特殊的荧光标记对长达几百kb的单链DNA分子进行成像,利用高质量图像使基因组结构通过酶切图谱的形式展现。

光学图谱的基本原理如下:

在大量细胞溶液中,DNA分子被随机剪切成为500kb左右的片段,随后通过微孔道DNA片段被拉伸,并且被附着到一个带有正电荷的玻璃支架上,接着利用特定的限制性内切酶在相应酶切位点进行切割DNA。将切割后的DNA分子用荧光染料染色后,在显微镜下拍照(图a-d)。Irys系统特有的超长读长可以轻松地跨越重复序列区域和一些包含复杂元件的DNA片段,这极大地简化了基因组的组装过程,提高基因组的组装效率,并且也很好的解决拼接缺口问题。光学图谱

(BioNano)沿着几百kb的DNA分子产生小序列结构的物理图谱(如限制酶识别位点) (Lam et al.,2021),不仅可以对Scaffolds进行排序和确定方向,并且也可以进行基因组组装质量评估。光学图谱(BioNano)初期主要应用于基因组较小的微生物基因组组装领域,现在已经广泛地应用在植物基因组组装领域。

图片

图a-d BioNano光学图谱构建示意图

Bionano技术简单来说,就是给分子加上荧光标记,然后拍照,所以最原始的下机数据就是TIFF格式,但是我们拿到的一般都是经AutoDetect/IrysView 转换过的BNX格式。

Bionano光学图谱展现了天然DNA分子的真实景观。利用SP DNA分离试剂盒获得超长DNA分子,用直接标记染色法(DLS)进行无损荧光标记,通过纳米微流控芯片将每一条DNA分子线性化展开,并进行高分辨率荧光成像,为基因组学下游应用提供原始DNA景观。这一真实的基因组物理图谱,为基因组组装提供了染色体尺度的框架,并能高效检测到大片段纯合子和杂合子结构变异。

https://www.jianshu.com/p/97743171e9f3

https://www.jianshu.com/p/cd04faae00f6

白菜参考基因组升级与染色质互作分析,张磊,2018.

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要用三代测序数据组装出染色体级别的基因组,可以按照以下步骤进行: 1. 数据预处理:对三代测序数据进行质量控制和过滤,去除低质量和含有适配器的reads。 2. 组装:使用基因组组装软件对经过预处理的数据进行组装。由于三代测序数据具有较长的read长度和较高的错误率,因此需要使用适合处理这种数据的组装算法,如Flye、Canu、wtdbg2等。 3. 内部一致性校正:对组装结果进行内部一致性校正,去除矛盾的序列,提高组装准确性。 4. 粘连区域处理:在染色体级别组装过程中,常常会出现粘连区域,即存在多个不同的序列可以组装在一起。可以使用长读比对、Hi-C数据等方法进行粘连区域的处理,得到最终的染色体级别组装结果。 5. 评估和改进:对组装结果进行评估和改进,比较组装结果和已知参考基因组的差异,并使用其他数据如RNA-seq数据进行验证和改进。 以上是组装染色体级别基因组的一般步骤,具体实施中还需要结合具体的数据情况和组装软件的特点进行调整和优化。 ### 回答2: 染色体级别的基因组组装需要经过以下几个步骤: 1. 数据质控:首先对三代测序数据进行质控,包括去除低质量碱基、修剪末端序列、去除接头序列等处理,确保数据的准确性和完整性。 2. 参考基因组比对:使用相关物种的参考基因组作为参考,将测序reads与参考基因组进行比对。此步骤可使用一些开源的比对工具,如Bowtie、BWA等。 3. 去重和拼接:根据比对结果,对重复的读取进行去重,然后将比对上的reads进行拼接,生成更长的序列。常用的拼接工具有SPAdes、SOAPdenovo等。 4. 错误矫正:对拼接得到的长序列进行错误矫正,去除可能存在的测序错误。可使用Quiver、LoRDEC等工具进行错误矫正。 5. 碱基错误矫正:使用相关物种的其他基因组信息,如原核生物的拓扑结构、转录本序列等,进行碱基错误矫正,提高结果的准确性。可使用Pilon、Racon等工具进行碱基错误矫正。 6. 持续迭代:以上步骤可能需要多次迭代进行,直至获得较完整且准确的染色体级别基因组。 7. 结果评估:通过与已知基因组的比对、基因预测和注释等方式对组装结果进行评估,验证基因组的准确性和完整性。 总之,染色体级别基因组组装利用三代测序数据,通过质控、比对、拼接、错误矫正等多个步骤,最终得到较完整、准确的基因组序列。然而,组装结果仍需综合其他实验验证,才能确保基因组的完整性和准确性。 ### 回答3: 要组装一个染色体级别的基因组,首先需要收集足够的三代测序数据。三代测序技术包括Illumina,PacBio和Nanopore等,它们提供了高质量、长读长的测序数据。 第一步是建立一个参考基因组序列。可以使用辅助测序技术,如BioNano或Hi-C,来获得染色体的全长信息。这些信息将帮助将测序数据映射到参考基因组上。 接下来,将三代测序数据与参考序列进行比对。根据每个数据集之间的重叠区域,可以通过重叠改正和序列拼接方法将读取连接起来。通过比对多个数据集,可以提高准确性并填充序列间的空隙。 然后,进行读取错误矫正。三代测序技术由于其相对较高的错误率,可能需要采取矫正措施。可以使用PacBio和Nanopore提供的高质量排序读取来矫正Illumina数据集中的错误。 在得到组装的序列后,需要通过重叠区域检测和破碎区域映射来验证和填充序列。通过比对之前得到的长读取和映射的链接信息,可以检测到重叠和破碎区域,并进行修复和连接。 最后,继续进行序列校准和错误修复。可以使用基于概率的方法,如polish read or consensus correction,来矫正残留的序列错误。 通过这些步骤,我们可以逐渐组装出一个染色体级别的基因组。但需要明确的是,基因组组装是一个复杂的过程,可能涉及到很多细节和步骤。因此,在实际实施中,可能需要借助各种基因组组装软件和技术来完成任务。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值