基因组组装的那些困扰,用单倍体基因组一一破解!

动植物基因组非常复杂,基因组大小、杂合度、GC含量、倍性等都会影响着基因组组装的难度和结果。特别是目前动植物基因组大多采用二倍体或多倍体材料直接进行测序组装,对于复杂基因组如高杂合、大基因组等,组装的难度很高

 

 

同时,二倍体或多倍体组装的结果混杂了双亲等位基因组的嵌合序列,可能会引入错误的基因注释信息。此时如果能进行单倍体基因组组装,不仅能降低组装难度,还能获得一套染色体组的序列。

 

什么是单倍体基因组?

二倍体拥有两套染色体组,对有性繁殖的物种来说,一套染色体组来源于母亲,另一套来源于父亲。下图展示了果蝇的染色体组,果蝇有4对共8条染色体,每一组中包括3条常染色体和1条性染色体。在生殖细胞形成过程中,经过减数分裂染色体的数目减半,获得的就是一套染色体组也叫单倍体。

图片

图1 果蝇染色体组示意图

 

相比高杂合物种(如常年自交不亲和、远缘杂交),一些杂合度和重复序列都占比较低的物种,其单倍体基因组组装的难度会低很多。高杂合物种基因组组装难度大,而且获得的嵌合基因组对后续这些物种的重测序、进化、基因功能等方面的研究都会产生不利影响。

如何构建单倍体基因组?

动植物可以采用单倍体生殖细胞测序来构建单倍体基因组,随着单细胞测序的发展,利用动物的配子进行测序组装是比较容易实现的。但是,从植物配子中分离和扩增DNA的一些挑战限制了这种方法在植物上的应用,如何才能有效解决呢?以下3个案例展示了单倍体基因组组装的技术升级之路,也提供了组装思路:

 

案例1:构建BAC文库,利用barcoding方法构建单倍体基因组

2019年10月,南京农业大学利用单花粉原生质体分离的新方法与单细胞DNA扩增技术相结合,利用12个花粉单细胞对所构建的3.8万条细菌人工染色体(Bacterial Artificial Chromosome,BAC)通过barcoding方法进行单倍型分型,并成功组装了两套单倍体基因组。通过这种方法鉴定出了原参考基因组中8.12%的由于杂合引起的嵌合组装基因。    

 

图片

图片

图2 利用barcoding方法进行单倍体定相的原理图

 

然而Barcoding方法需要构建BAC文库,比较耗时耗力。随着长读长测序技术的发展,现在可以保证读长准确度兼具,基于此,下述案例中利用长读长测序构建单倍体基因组成为可能。

 

案例2:短读长+长读长测序组装结合遗传图谱实现马铃薯单倍体基因组组装

2020年9月,中国农科院基因组所在Nature Genetics 在线发表杂合二倍体马铃薯的单倍体基因组组装结果。研究人员采用了短读长测序和长读长测序结合的方法进行了二倍体马铃薯RH89-039-16的基因组组装。研究同时测序了RH的自交分离群体构建遗传连锁图谱,利用遗传图谱成功将同源片段区分成两套单体型。最后在Hi-C数据的辅助下,组装片段被锚定在染色体上,成功实现了染色体级别的单体型组装。

 

对基因组的两套单体型序列进行比较分析发现,二倍体马铃薯内存在等位基因表达差异甲基化差异。而且Haplotype-resolved识别有害突变,特别是在互斥的紧密相连的基因,为分子选择和/或基因组编辑技术有效清除突变负担提供方便。

图片

图片

图3 多平台联合组装获得二倍体马铃薯的单体型基因组

 

表1 马铃薯三个组装结果比较

图片

 

案例3:PacBio HiFi测序组装苹果单倍体基因组

2020年11月,美国康奈尔大学与USDA-ARS植物遗传资源研究中心合作在Nature Genetics上发布了苹果的单倍体基因组。研究利用623-780X不同梯度文库(450/800bp/2-4K/5-7K/8-10K)短读长测序和10X Genomics测序,37-81X PacBio HiFi测序组装获得了栽培苹果(Malus domesticacv. Gala)及其两个主要的祖先种野生苹果(M. sieversii和 M. sylvestris)的单倍体基因组(Phased diploid genome)。

 

图片

图片

图4 基因组组装、纠错和定相流程

 

现代栽培苹果(Malus domesticaBorkh.) 从不同的野生祖先种杂交并通过无性繁殖的方式繁衍形成,因此苹果基因组高度杂合,这对早期苹果基因组的组装是一个重大的挑战。本研究的单倍体基因组获得了高准确度高连续性的组装片段,得到目前最高质量的苹果参考基因组。基于单倍体基因组,鉴定到广泛的基因组变异位点和栽培苹果中的杂交重组区域,同时为高分辨率的等位基因特异性表达(allele-specific expression, ASE)分析提供了极大的帮助。

表2 苹果基因组组装结果统计

图片

 

从上述案例可以看出,为了获得单倍体基因组的phasing信息,有时需要借助BAC文库或遗传图谱,这些过程比较耗时耗力。而今随着长读长测序技术的发展,构建单倍体基因组的过程可以进一步简化。

 

文献链接:

1.https://genome.cshlp.org/content/29/11/1889

2.https://www.nature.com/articles/s41588-020-0699-x

3.https://www.nature.com/articles/s41588-020-00723-9

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值