Nature Genetics | 朱玉贤院士团队发布首个棉花基因组完整图谱,阐述棉族独特折叠胚胎形成的分子与演化机制...

植物种子及其周围结构提供的营养维持了人类文明的延续与发展。植物种子胚胎是营养的储存器,展现出丰富的结构多样性,反映了植物在进化过程中对环境适应的独特策略。1946年,早期植物学家A. C. Martin根据种子胚胎大小和形态特征,将植物种子胚胎划分为10种类型 (Martin, 1946),其中被子植物的胚胎通常表现为叶轴型(Foliate axile types, FA),包含了四种基本类型,即Spatulate(FA1)、Bent(FA2)、Folding(FA3)和Investing(FA4)。

棉花(锦葵科植物)作为全球最重要的经济作物之一,具有复杂折叠的叶轴型胚胎,一般情况下,其子叶通过多层折叠完全包裹胚轴和胚根。与锦葵科近缘物种木槿相比,棉花显然经历了种子胚胎形态革新,从简单折叠胚(FA3)演变成复杂折叠胚类型(complex FA3),这种复杂折叠胚胎被认为是被子植物中发育最完全、最复杂胚胎类型(图1)。胚胎复杂折叠不仅能够保护胚根和胚轴,而且种子变大,能在有限种子空间内包裹最多的子叶从而提升储存营养资源的容量。同时,这一结构还与种子萌发、休眠及对环境的适应性密切相关 (Fryxell, 1978)。然而,棉花复杂折叠胚胎的发育过程及其背后的分子机制尚未被研究。

自朱玉贤院士团队与合作者在2012年首次公布雷蒙德氏棉基因组以来,棉花基因组学取得了一系列重要进展,推动了功能基因组学研究以及棉花复杂性状的解析 (Du et al., 2018; Huang et al., 2021; Huang et al., 2020; Wang et al., 2012)。然而,棉花基因组的准确与完整解析,尤其是复杂的转座子序列及其生物学功能,尚需深入研究与探讨。

dd26a15a32c01a09b0748a6a968593fe.jpeg

图1 棉花通过种子胚胎形态革新产生复杂折叠胚胎

2024年8月15日,武汉大学/北京大学教授朱玉贤,北京大学博士后黄盖(现为中国科学院遗传与发育生物学研究所副研究员)为主要作者在国际知名期刊Nature Genetics发表题为A telomere-to-telomere cotton genome assembly reveals centromere evolution and a Mutator transposon-linked module regulating embryo development的研究论文。该研究通过解析首个端粒到端粒的雷蒙德氏棉(Gossypium raimondii,四倍体棉的祖先种)基因组完整序列图谱,揭示了其独特的着丝粒结构类型及表观图谱。通过深入挖掘功能性转座子,发现由三个新分子(miR2947-DNA转座子MuTC01-加倍基因LEC2b)组成的三级小RNA调控机制,从而阐明了棉花复杂折叠胚胎形成的分子调控与演化机制 (Huang et al., 2024)。

a61933528205c007d617f2da8aec6597.png

图2 朱玉贤院士团队在棉花基因组和功能研究取得重要进展

该研究整合了最新的测序技术和算法,成功获得了776 Mb首个二倍体棉花基因组完整序列图谱。与以往基因组版本相比,首个棉花基因组完整序列图谱具有高连续性和完整性,成功组装了着丝粒和端粒序列,并对转座子和基因进行了更精确和完整的注释,识别出53167个蛋白质编码基因,显著高于以往版本(37505–40976个基因)。此外,T2T基因组还修正了之前版本中的错误序列,主要是涉及着丝粒、端粒等复杂区域。通过深入解析着丝粒序列,发现了雷蒙德氏棉着丝粒独特的结构与组成(图3)。雷蒙德氏棉着丝粒主要由LTR类转座子构成,缺乏短着丝粒微卫星序列,展现出与其他植物显著不同的特征。此外,雷蒙德氏棉的着丝粒缺乏典型的核小体有相位的排布规律,这一差异主要源于其着丝粒的形成过程直接受到长末端重复逆转录转座子入侵的影响。

eb6e5af88f309c3f6ceb669402f8cfff.png

图3 雷蒙德氏棉基因组具有独特的着丝粒结构

基于基因组完整序列图谱,研究者对棉花转座子进行精准鉴定,得到了872549条非冗余转座子序列。棉花含有丰富的TIR类转座子,其中Mutator家族是最主要的TIR类型。转座子元件表达分析发现,只有约2%的序列编码了具有转录活性的转座子,而在棉花胚胎发育晚期有88个转座子在子叶阶段表现出组织特异性表达特性(图4)。这些具有组织特异活性转座子中,仅DNA MuDR转座子(命名为MuTC01)能够产生最丰富的正负链小RNA,是反式作用siRNA产生位点。分析发现,MuTC01起源于DNA转座子Mutator家族,在全基因组中具有34个同源拷贝,只有MuTC01能产生高丰度的siRNA,预示MuTC01可能通过siRNA在棉花胚胎发育过程中发挥作用。

13828a9072efe447c600944875bd5373.png

图4转座子功能分析揭示了胚珠特异表达并产生siRNA的MuTC01转座子

通过靶向预测以及降解组分析,他们发现MuTC01受棉花特异的miR2947靶向切割产生有相位的siRNA(图5)。进一步通过CRISPR–Cas9基因编辑技术,对棉花的miR2947和MuTC01进行基因突变实验。电镜观察成熟胚胎形态显示,突变体mir2947mutc01都表现出胚胎发育异常表型,子叶没有被完整包裹和折叠。

e6cd2b8fa26af9d0af779d584b19cbf9.png

图5 miR2947靶向MuTC01产生小RNA调控棉花胚胎折叠

通过对棉花胚胎发育轨迹进行切片观察(图6),显示棉花突变体 mutc01mir2947均会导致胚胎折叠异常的表型,特别是在胚胎发育后期(开花后23天以后)变得尤为明显。这些结果表明 miR2947–MuTC01调控模块在棉花胚胎发育中起到关键调控作用,突变体胚胎形态与近缘种木槿相似,表明miR2947–MuTC01 调控模块很可能是棉花胚胎复杂折叠类型形成的关键因素。

f078603aec5d86ecc7897353960c99a6.jpeg

图6棉花突变体胚胎发育轨迹切片观察

为进一步探究miR2947–MuTC01调控模块下游的靶标,他们结合靶位点分析、转录分析以及切割位点验证等实验,确定MuTC01产生的22-nt siRNA(命名为siRNA_22nt)能够靶向棉花LEC2b基因(图7)。系统演化分析发现,LEC2基因起源于棉属全基因组加倍事件,在棉花中有两个拷贝,分别命名为LEC2aLEC2b。与拟南芥、可可同源的拷贝为LEC2a,棉花独特的基因为LEC2bLEC2aLEC2b在第一个外显子区域存在553 bp的变异区域,使得MuTC01能靶向LEC2b产生21-nt有相位的siRNA,而不能靶向LEC2a。两个同源基因独特的序列和调控演化暗示LEC2aLEC2b存在功能分化。

beed510cb1bd1104fd62520240765608.png

图7由miR2947-MuTC01-LEC2b组成的三分子模块调控棉花胚胎折叠

作者进一步利用基因编辑实验创造了三个棉花突变体(图7),包括:在LEC2b的第一个外显子区域设计两个sgRNA,编辑siRNA_22nt 靶向LEC2b的区域,获得棉花突变体lec2b-2;在LEC2b外显子设计四个sgRNA,编辑LEC2b蛋白质编码区,而不编辑siRNA_22nt靶向区域,获得棉花突变体lec2b-1;在LEC2a设计两个sgRNA,编辑LEC2a蛋白质编码区,获得棉花突变体lec2a。他们通过棉花胚胎的发育轨迹进行切片观察,发现棉花突变体lec2alec2b-1在棉花胚胎发育过程中无明显的发育异常表型,而lec2b-2突变体子叶不能正确包裹胚胎,类似于mutc01mir2947等棉花突变体,且在胚胎发育后期(开花后23天以后)变得尤为明显。

作者进一步检测五个棉花突变体(mir2947, mutc01, lec2a, lec2b-1, lec2b-2)在LEC2b基因位点的siRNA表达水平(图7)。数据表明,在mir2947, mutc01lec2b-2棉花突变体背景下,LEC2b基因位点有相位的siRNA消失,而在lec2alec2b-1突变体背景下,不影响LEC2b基因位点的siRNA的产生。这个siRNA分布情况与突变体的表型完全一致。这些数据表明,miR2947–MuTC01–LEC2b三分子模块是通过LEC2b产生三级siRNA控制棉花胚胎复杂折叠,而不是通过影响LEC2b蛋白质功能而发挥作用。

作者进一步探究miR2947–MuTC01–LEC2b三分子模块的起源与演化(图8),结果表明该三分子模块同时存在于具有复杂折叠胚胎类型的整个棉族(包括棉属在内的100多个种),显著不同于其近缘物种木槿族所具有的简单折叠胚胎类型。因此,作者提出了三级小RNA调控棉族独特胚胎类型的分子和演化机制,即棉族特异的MIR2947产生第一级22-nt的miR2947,直接靶向DNA转座子MuTC01,产生第二级小RNA,再靶向全基因组加倍产生的LEC2b基因,产生第三级小RNA,从而调控棉族复杂折叠胚胎形成(图8)。这项研究系首次在植物界发现具有功能的三级小RNA调控机制,也是首次从发育角度阐释棉族复杂胚胎折叠过程以及背后的分子与演化机制。

aca1ce555d80ce492cc72e96d3fff6cb.png

图8 棉族复杂折叠胚胎形成的分子和演化机制

北京大学博士后黄盖(现为中国科学院遗传与发育生物学研究所副研究员)是论文的第一作者,黄盖博士和武汉大学/北京大学朱玉贤教授为论文的通讯作者,中国科学院遗传与发育生物学研究所曹晓风院士,南方科技大学翟继先教授和冯丽博士,美国爱荷华州立大学Jonathan F. Wendel教授,德国马克斯普朗克生物研究所鲍志贵博士等参与了该论文工作,提供了相应的指导和建议。本研究得到国家自然科学基础科学研究中心项目资助。

参考文献

Du, X., Huang, G., He, S., Yang, Z., Sun, G., Ma, X., Li, N., Zhang, X., Sun, J., Liu, M., et al. (2018). Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits. Nat. Genet. 50:796–802. 10.1038/s41588-018-0116-x.

Fryxell, P.A. (1978). The Natural History of the Cotton Tribe (Malvaceae, Tribe Gossypieae). (Texas A & M University Press).

Huang, G., Huang, J.-Q., Chen, X.-Y., and Zhu, Y.-X. (2021). Recent advances and future perspectives in cotton research. Annu Rev Plant Biol 72:437–462. 10.1146/annurev-arplant-080720-113241.

Huang, G., Bao, Z., Feng, L., Zhai, J., Wendel, J.F., Cao, X., and Zhu, Y. (2024). A telomere-to-telomere cotton genome assembly reveals centromere evolution and a Mutator transposon-linked module regulating embryo development. Nat. Genet. 10.1038/s41588-024-01877-6.

Huang, G., Wu, Z., Percy, R.G., Bai, M., Li, Y., Frelichowski, J.E., Hu, J., Wang, K., Yu, J.Z., and Zhu, Y. (2020). Genome sequence of Gossypium herbaceum, and genome update of G. arboreum and G. hirsutum provide insights into cotton A-genome evolution. Nat. Genet. 52:516–524. 10.1038/s41588-020-0607-4.

Martin, A.C. (1946). The comparative internal morphology of seeds. Am Midl Nat 36:513–660. 10.2307/2421457.

Wang, K., Wang, Z., Li, F., Ye, W., Wang, J., Song, G., Yue, Z., Cong, L., Shang, H., Zhu, S., et al. (2012). The draft genome of a diploid cotton Gossypium raimondii. Nat. Genet. 44:1098–1103. 10.1038/ng.2371.

论文链接:

https://doi.org/10.1038/s41588-024-01877-6

高颜值免费 SCI 在线绘图(点击图片直达)

336c967a92da940902b8f964f44aff83.png

最全植物基因组数据库IMP (点击图片直达)

336f58a45fbf3f5b89f7263d0b5fb093.png

往期精品(点击图片直达文字对应教程)

afd9aaef79de3aeb83030e7d989fba96.jpeg

d2bc8c1a47d821fa053a3edb455507ee.jpeg

e6d4eca267d9757b3ca58210392d962b.jpeg

b303728ac763b3657608371e639b2708.jpeg

1b69c8c90592ff4042bfc2a29aa63ba4.jpeg

2bb63e31edb3957a6ffa1fe5af1bdaee.jpeg

a8a84b3ca678c9a1c590e13b59241267.jpeg

a909a6a6b1a4e7551cdb3f89df4574ac.jpeg

1530d8ca9ff7b05c1ea705481e8e6b6e.jpeg

6558bd1d88de9bb23f1c8bab70b4578a.jpeg

406292c4cfafde0c6ed38b334de5e39f.jpeg

4c20243b898a19087d2590ad62ce9b2d.jpeg

57900a6f44c0355df41f54208b18fa8d.png

5d7fa70a7538365a5009fc8f67a15bcc.png

da4445b4ff03d15ec1bfa2bf9e001692.png

23cab46f4edafa5e0bb9b3747c2d884d.png

f72d0168ad0bd62948ac3b692b526859.jpeg

9d5c2b019e1da897434b3709b010582d.jpeg

08bf2702afab22a20dd8f76445374f5f.jpeg

cf7b49bdc17504b129416694d0da16bb.jpeg

1be13907c26c143119c98abf29ca8dbb.png

c41f4ba034e95a01efa494b1e3901f00.png

4e860161348291c78652f2f8b24237d9.jpeg

d8222c669b54e45d82f7f3c83289821d.png

d8fbaf0c30a68ff3ae047990931ee048.png

fb149cdfc1e042669e819d2d90bbe3f6.jpeg

8a2d19339a8808f9d1dac5c27c9c89bb.png

e66973aae0ca5e301429be6f69a61d93.png

机器学习

8cd0115492c3fe791185598cc73dd17f.jpeg

08fdd39a05068f4495886ef546017775.jpeg

c414ca050e242f2d992ac2f3e0ae9891.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值