木本植物泛基因组文章盘点和解析

图片

基因组包含了生物体的全套遗传信息,研究中通常会将一个物种中重要的品系或者最先测出的基因组作为参考基因组,并以此为基础进行个体或群体水平的遗传变异分析。然而, 由于地域、环境等因素的影响,同一物种内的不同个体间存在着丰富的遗传变异,来自单一个体的参考基因组难以覆盖物种群体的遗传多样性[1]。

以植物为例,栽培作物与其野生祖先相比,长期强烈的人工选择导致了严重的遗传瓶颈,栽培品种的遗传多样性显著降低。而作物的参考基因组常常来自栽培品种,显然无法代表野生种丰富的遗传变异,限制了对作物进化和驯化历史的深入研究[1]。鉴于参考基因组的局限性,研究者提出了泛基因组(Pan-genome)的概念。泛基因组自提出以来广泛用于细菌和动植物的研究,PubMed相关的研究报道逐年增长,并且多次登顶CNS级别的文章。

图片

PubMed收录的与泛基因组有关的文章

木本植物不仅是我们生态系统的重要组成部分,同时也是许多经济作物的基础,比如苹果、柑橘、茶树等。本期,我们将深入探讨木本植物泛基因组研究的最新进展,通过汇总分析已发表的文章,展示这一领域的科研成果及其对我们泛基因组研究的启示。

 文献案例 

文献一:茶树泛基因组技术的基因挖掘与基因组学辅助育种

Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia sinensis

图片

  • 发表单位:中国农业科学院深圳农业基因组研究所

  • 发表期间:Nature Plants

  • 发表时间:2023

  • 材料选择:22个茶树品种(18个测序组装,4个来自已发表数据),品种来自三类:17个中华种(C. sinensis var. Sinensis,CSS),4个阿萨姆种(C. sinensis var. Assamica,CSA),1个白毛茶(C. sinensis var. Pubilimba,CSP),组织选取幼叶;

  • 测序策略:PacBio(平均53×)+Hi-C+RNA-seq

  • 生物学问题:研究主要关注茶树叶色差异(叶绿素、类黄酮、花青素等)、芽期、香气(儿茶素)等多个重要农艺性状相关的遗传变异,为茶树基因挖掘和分子育种提供了重要参考。

  • 组学技术:转录组+非靶向代谢组(已发表数据)

  • 主要内容

茶是世界上最古老的作物之一,其栽培目的是为了生产出各种口味的饮料。尽管测序技术有所进步,但茶的关键农艺性状背后的遗传机制仍不明确。研究呈现了22个优良品种的高质量泛基因组,代表了该物种广泛的遗传多样性。分析显示,最近的长末端重复爆发贡献了近20%的基因拷贝,引入了影响如叶色等表型的功能性遗传变异。图形泛基因组提高了全基因组关联研究的效率,并允许识别控制芽苞发生时机的关键基因。研究还发现等位变异与口味相关化学成分之间有强的相关性。这些发现加深了我们对茶质量遗传基础的理解,并提供了宝贵的基因组资源,以促进其基因组辅助育种。

图片

图:基于22个de nove组装的茶叶基因组,检测结构变异(SVs)并构建泛基因组。

文献二:泛基因组分析为深入了解柑橘亚家族的进化和柑橘果实中柠檬酸积累的关键基因提供了线索

Pangenome analysis provides insight into the evolution of the orange subfamily and a key gene for citric acid accumulation in citrus fruits

图片

  • 发表单位:华中农业大学

  • 发表期间:Nature Genetics

  • 发表时间:2023

  • 材料选择:18个物种:6柑橘相关属的6个代表性物种和6个柑橘属物种测序组装;还有6个已发表的柑橘属的基因组数据;柑橘属既有栽培种,也有野生种;取材来自古印度板块、非洲、中国南中部等;组织类型为果肉。

  • 测序策略:Nanopore/PacBio(42.9-164.5×)+Illumina+Hi-C

  • 组学技术:广泛靶向代谢组+基因组+转录组

  • 生物学问题:进化起源和果实味道(柠檬酸)演化的调控机制

  • 验证技术:基因编辑、EMSA、双荧光素酶

  • 主要内容

柑橘亚科(Aurantioideae)包括了全球范围内种植的几种柑橘属植物,如甜橙和柠檬。柑橘种的起源一直存在争议,关于柑橘亚科的了解也相对较少。在该研究中,汇编了314个品种的基因组序列,新组装了12种物种的基因组,并为柑橘亚科构建了基于图的泛基因组。分析表明,古印度板块是柑橘相关属的祖先区域,而中国南中部是柑橘属的主要起源中心。研究发现,与柑橘相关属相比,柑橘属中PH4基因的序列和表达存在大量变异。基因编辑和生化实验表明,PH4在柑橘果实中积累柠檬酸的过程中发挥了核心作用。这项研究为柑橘亚科的起源和进化以及果实味道演化的调控机制提供了洞见。

图片

图:柑橘亚科的泛基因组分析

献三:四个染色体规模的基因组和一个泛基因组注释促进山核桃树的育种

Four chromosome scale genomes and a pangenome annotation to accelerate pecan tree Breeding

图片

  • 发表单位:哈德逊阿尔法生物技术研究所

  • 发表期间:Nature Communications

  • 发表时间:2021

  • 材料选择:三个栽培种(Pawnee、Lakota、Elliott)及1个野生种(Oaxaca),组织类型为叶片

  • 测序策略:三个材料(Oaxaca、Elliott和Lakota)PacBio测序(78.9×-135.3×)和Illumina测序(HiSeq X Ten和2500,50-60×)的策略,而材料Pawnee组装是用PacBio HiFi测序(52.1×)构建,最后借助Hi-C从而获得了四个染色体级别的高质量参考基因组

  • 生物学问题:育种,抗虫抗病性分析

  • 主要内容

基因组技术有潜力加速长寿多年生作物物种的育种工作。尽管分子工具在山核桃和其他异交树种中具有变革性的潜力,但高度杂合子的基因组、显著的存在-缺失基因内容变异以及种间杂交的历史限制了育种工作。为了克服这些挑战,在这里,研究提出了四个远缘杂交的山核桃基因型的二倍体基因组组装和注释,包括一个PacBio HiFi染色体规模组装的两个单倍型的“Pawnee”品种。比较分析和泛基因组整合揭示了大量的和可能的适应性种间基因组渐渗,包括一个从苦桃山核桃渗入山核桃育种家系的过度保留的单倍型。此外,通过利用泛基因组存在-缺失和功能注释数据库,在基因组之间的两个远缘杂交单倍型“Lakota”基因组中,确定了害虫和病原体抗性的候选基因。综合起来,这些分析和资源突出了高度多样性和远系作物在功能和定量基因组学方面的重大进展。

图片

图:4个重新组装山核桃基因组的比较分析和泛基因组分析。

文献四:对13份苹果属材料的泛基因组分析,揭示了与果实性状相关的结构和序列变异

Pan-genome analysis of 13 Malus accessions reveals structural and sequence variations associated with fruit traits

图片

  • 发表单位:中国农业大学

  • 发表期刊:Nature Communications

  • 发表时间:2023

  • 材料选择:4个野生种和9个栽培种,组织为成熟果实(其中3个为已发表数据)

  • 测序策略:PacBio Hifi(27.82-53.15X),Hi-C和Illumina

  • 生物学问题:主要关注驯化、果实发育和品质等,代谢物方面主要关注了影响果实颜色的花青素

  • 组学技术:转录组,花青素检测(HPLC分析)

  • 验证技术:瞬时过表达表型检测,RT-qPCR,双荧光素酶实验

  • 主要内容

结构变异(SVs)和拷贝数变异(CNVs)对多肉果类物种的性状变异起到贡献。在这里,组装了10个基因型多样的苹果(Malus)品种的基因组,包括常绿栽培品种‘Granny Smith’和广泛栽培的品种‘Red Fuji’。结合三个先前报道的基因组,研究组装了苹果物种的泛基因组,并鉴定了20,220个CNVs和317,393个SVs。研究还观察到CNVs与其相关基因的表达水平呈正相关。此外,研究展示了源自线粒体激活蛋白激酶同源编码基因MMK2内含子中的209 bp插入所产生的非编码RNA,调节了基因表达并影响了果实颜色。此外,研究鉴定了与果实品质和生物抗性相关的重叠SVs。这一泛基因组揭示了CNVs对基因表达的可能贡献,并突出了SVs在苹果驯化和经济重要性状中的作用。

图片

图:13份苹果材料的泛基因组分析和核心基因组分析

文献五:杨树的超级泛基因组揭示了其在广泛分布的森林树木中适应和多样化的基因组特征

The super-pangenome of Populus unveils genomic facets for its adaptation and diversification in widespread forest trees

图片

  • 发表单位:四川大学生命科学学院和南京林业大学

  • 发表期刊:Molecular Plant

  • 发表时间:2024

  • 材料选择:为了描述杨属植物的超级泛基因组结构,从杨属植物的五个部分选择了19个参考基因组,包括18个野生种(一个种包括两个亚种),其中6个是该研究在染色体水平上从头组装的,另外13个是在其他研究中已发表的。

  • 测序策略:Nanopore(平均88.53X)+Illumina(平均57.13X)+Hi-C(平均152.93X)

  • 生物学问题:遗传多样性、进化、适应性和叶子形态等

  • 组学技术:转录组、WGBS、ATAC-seq

  • 验证技术:RT-qPCR、双荧光素酶实验

  • 主要内容

在进化研究中,理解基因组演化与适应性创新之间的潜在机制和联系是一个重要目标。杨树作为世界上分布最广泛且栽培最多的树木之一,展示了广泛的表型多样性和环境适应性。在这项研究中,呈现了一个包含19个杨树基因组的属级超级泛基因组,揭示了特有基因在促进本地环境和气候适应中的关键作用。

通过将泛基因组与转录组、甲基化组和染色质可及性图谱整合,研究揭示了泛基因和重复基因的演化轨迹与本地基因组调控景观和表观遗传结构的密切联系,特别是基因体区域的CG甲基化。进一步的比较基因组分析已经实现了跨物种的142,202个结构变异的鉴定,这些变异与大量基因交叉,并在表型和适应性分化方面做出了重大贡献。研究已经实验证实了一个影响CUC2基因表达的约180个碱基对存在/缺失变异,这对于叶边缘锯齿形成至关重要。最后,作者开发了一个用户友好的基于网络的工具,涵盖了与杨树超级泛基因组相关的多组学资源(http://www.populus-superpangenome.com)。总的来说,这一先驱性的森林树木超级泛基因组资源不仅有助于推动这一全球重要树木属的育种工作,还为理解树木生物学的潜在途径提供了宝贵的见解。

图片

图:基因空间上的泛基因组分析

 泛基因组研究特点 

结合这些文章的盘点,我们聊聊泛基因组的研究特点。

样本选择:泛基因组的样本选择(样本数量和特性)对基因组的质量和完整性有非常大的影响。亲缘关系近的材料会降低泛基因组的大小,野生种质和栽培种质的结合能够产生更大规模的泛基因组。为尽可能低成本捕获物种所有的基因组信息,可以基于经验或群体结构信息选择最具代表性的个体进行泛基因组构建。结合以上这些文献,材料选取可以从几个方向考虑:不同亚种,栽培种和野生种,不同地域的种质资源等。

测序策略:泛基因组构建通常采用三代+二代的测序策略,同时以Hi-C和转录组辅助组装和注释。在生物学问题上主要关注驯化、遗传多样性、适应机制和抗性等方面,还会探讨分析颜色、果实品质相关代谢物的农艺性状。

分析和验证:泛基因组分析流程包括前期组装注释和后期分析,后期分析主要涉及泛基因组特征分析、变异检测、比较基因组分析和图形泛基因组构建等。有时会结合其他组学(如转录组、代谢组、表观组等)或表型数据进行多组学分析,涉及GWAS、QTL等分析。在代谢物方面,重点关注影响颜色、品质等代谢物;验证相关性状候选基因通常结合RT-qPCR、双荧光素酶实验、基因编辑/过表达突变体等方法。欢迎有相关需求的老师联系我们~

图片

  • 参考文献:

  1.    郝晨路,於晓芬,曲明昊,赖恩惠,郭素敏,高磊. 植物泛基因组研究进展与展望[J].植物科学学报,2022,40(1):124-132.

  • 8
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值