文献翻译:Genomic features of bacterial adaptation to plants

在这里插入图片描述
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5957079/

摘要

植物与各种细菌有密切的联系。
植物相关(PA)细菌表面上已经进化出能够适应植物环境的基因。
然而,这些基因的身份大多是未知的,它们的功能很差的特点。
我们对芸薹科、杨树和玉米根中的484株细菌进行了基因组测序。
然后我们比较了3837个细菌基因组,以确定数以千计的PA基因簇。
PA细菌的基因组编码更多的碳水化合物代谢功能和更少的移动元素比相关的非植物相关基因组。
我们通过实验验证了两组PA基因的候选基因,一组参与植物定殖,另一组参与PA细菌之间的微生物竞争。
我们还鉴定了64个PA蛋白结构域,这些结构域可能模拟植物结构域;有些是PA真菌和卵菌共有的。
这项工作扩展了基于基因组的植物-微生物相互作用的理解,并通过微生物组工程为高效和可持续农业提供了线索。

背景

动植物的微生物群已经与宿主共同进化了数百万年。
由于光合作用,植物是多种细菌群落的丰富碳源。
这些包括共生者和共产主义者,以及病原体。
植物病原菌和植物生长促进细菌对植物生长、健康和生产力有显著影响4-7。
除了深入研究豆科植物根瘤、农杆菌m9的T-DNA转移、Ⅲ型分泌介导的致病因子esi10等关系外,对植物微生物相互作用的分子机制的理解还相当有限。
因此,识别和鉴定细菌基因和功能对于帮助微生物在植物环境中繁衍的作用是非常重要的。
这些知识应提高我们防治植物疾病的能力,并利用有益的细菌功能,直接影响全球粮食安全、生物能源和碳封存。

基于标记基因分析或喷枪元基因组测序的独立培养方法,大大提高了我们对植物环境中微生物生态学的理解11-15。
同时,测序成本的降低使得植物相关细菌(PA)菌株的基因组测序在大范围内16。
重要的是,隔离物能够在硅预测中进行功能验证。
分离基因组还为单个基因提供基因组和进化背景,以及能够访问由于测序深度有限而可能被元基因组学遗漏的稀有生物基因组的能力。
虽然亚基因组测序具有捕获未培养生物体DNA的优势,但多项16srrna基因调查结果表明,最常见的植物相关细菌主要来自4个易于培养的植物13,17(蛋白质细菌、放线杆菌、类杆菌和硬种皮)。
因此,在对植物微生物瘤16中丰富的成员进行取样时,细菌培养不是主要限制。

我们的目的是鉴定有助于细菌适应植物的基因(植物相关基因)和那些特别有助于细菌根定植的基因(根相关基因)。
我们对484个新分离的细菌和来自芸薹科、玉米和杨树根部的单个细菌细胞进行了基因组测序。
我们将新测序的基因组与现有的基因组组合成一个包含3837个高质量、非冗余基因组的数据集。
然后,我们发展了一种计算方法,以确定植物相关(PA)基因和根相关(RA)基因的基础上比较系统发育相关的基因组与知识的起源隔离。
我们通过实验验证了两组PA基因,包括一个在植物相关微生物竞争中起作用的新基因家族。
此外,我们还对不同门的细菌之间,甚至细菌与真核生物之间共享的许多PA基因进行了表征。
这项研究代表了一个全面和公正的努力,以确定和表征候选基因所需的细菌-植物界面。

结果

扩展植物相关细菌参考目录

为了获得一个完整的PA细菌参考基因组集,我们分别从芸薹科(91%来自拟南芥)、杨树(毛果杨和三角杨)和玉米中分离并测序了191、135和51个新菌株(方法见表1,补充表1-3)。
这些细菌是从植物的根内部(内生室)、根表面(根面)或附着于根(根际)的土壤中分离出来的。
此外,我们还对拟兰介表面灭菌根中107个单细菌细胞进行了分离和测序。
所有的基因组都在公共数据库和一个专门的网站上组装、注释和保存(见网址,补充表3,方法)。

在这里插入图片描述

一个广泛的,高质量的细菌基因组集合

除了上述新测序的基因组外,我们还利用公共数据库收集了5587个细菌基因组,这些基因组属于PA细菌的四个最丰富的门13(方法)。
我们根据其明确的分离生态位将每个基因组手动分类为PA、非植物相关(NPA)或土壤衍生(方法,补充表1-2)。
PA基因组包括从植物或根际分离的生物体。当从根平面或根内生室分离时,PA细菌的一个子集也被注释为“RA”。
从土壤中分离出来的细菌基因组被认为是一个独立的类群,因为这些菌株是否能积极地与植物结合尚不清楚。
最后,将剩下的基因组标记为非植物相关(NPA)基因组;它们是从不同的环境中分离出来的,包括人类、动物、空气、沉积物和水生环境。

我们进行了严格的质量控制过程,以消除低质量或冗余的基因组(方法)。
这导致了最终的3837个高质量和非冗余基因组的数据集,包括1160个PA基因组,其中523个也是RA。
这3837个基因组分为9个单系分类群,以便在系统发育相关基因组之间进行比较基因组学(图1a,补充表1-2,方法,URL)。

为了确定我们从培养分离物中收集的基因组是否代表了植物相关细菌群落,我们分析了来自拟南芥11、12、大麦18、小麦和黄瓜14植物环境的培养无关的16S rDNA调查和亚基因组(方法)。
这里分析的9个分类群占PA环境中发现的细菌群落总数的33-76%(中位数41%,补充表4),因此代表了植物微生物群的重要部分,与以前的报告13、16、19一致。
在这里插入图片描述

Figure 1
Genome dataset used in analysis and differences in gene category abundances

a. Maximum likelihood phylogenetic tree of 3837 high quality and non-redundant bacterial genomes based on the concatenated alignment of 31 single copy genes. Outer ring denotes the taxonomic group, central ring denotes the isolation source, and inner ring denotes the RA genomes within PA genomes. Taxon names are color-coded based on phylum: green – Proteobacteria, red – Firmicutes, blue – Bacteroidetes, purple - Actinobacteria. See URLs for ITOL interactive phylogenetic tree.

图1
用于分析的基因组数据集和基因类别丰度的差异
a 基于31个单拷贝基因串联比对的3837个高质量非冗余细菌基因组的最大似然系统发育树。外圈表示分类学类群,中环表示分离源,内圈表示PA基因组中的RA基因组。
分类单元名称是基于门的颜色编码:绿色-变形细菌,红色-厚壁菌,蓝色-拟杆菌,紫色-放线菌。
有关ITOL交互式系统发育树,请参见URL。

PA基因组:更多的糖代谢,更少的移动元素

我们比较了从植物环境中分离的细菌与从非植物环境中分离的共有祖先的细菌的基因组。
这两个群体在适应特定生态位的过程中进化出的一组辅助基因应该是不同的。
比较PA、土壤和NPA基因组的大小发现,PA和/或土壤基因组显著大于NPA基因组(P<0.05,PhyloGLM和t检验,补充图1a,补充表5)。
在9个分析类群中的6-7个类群中观察到了这种趋势(取决于测试),代表了所有四个门。
有PA和NPA分离位点的少数属的泛基因组分析显示PA和NPA基因组之间的泛基因组大小相似(补充图2)。

泛基因组(Pan-genome)研究思路与应用—作物篇

接下来,我们使用26个广泛的功能基因类别(补充表6),研究了PA基因组中某些基因类别与NPA对应基因相比是否富集或缺失。
使用PhyloGLM检验(图1b)和t检验(补充图3)检测富集。
两类基因表现出相似的独立于系统发育的趋势,暗示了一个依赖环境的选择过程
“碳水化合物代谢和转运”基因类别在六个分类群的PA生物体中得到扩展(图1b,上图)。
这是α变形杆菌、拟杆菌、黄单胞菌科和假单胞菌中扩展最广的一类(补充图3,上图)。
相比之下,四个PA分类群中的可移动遗传元件(噬菌体和转座子)表达不足(图1b和补充图3,上面板)。
有趣的是,PA基因组显示出基因组大小的增加,尽管移动元素减少,而移动元素通常作为水平基因转移和基因组扩展的载体。
RA细菌与土壤细菌的比较显示,与PA和NPA组相比,RA细菌的变化不那么剧烈,正如生活在更相似生境中的生物体所预期的那样(图1b和补充图3,下面板)。

在这里插入图片描述

b. Differences in gene categories between PA/NPA (top panel) and RA/soil (bottom panel) genomes of the same taxon. For both panels, the heat map indicates the level of enrichment or depletion based on a PhyloGLM test. Significant (colored) cells have p value < 0.05, FDR corrected. Hot colored cells indicate significantly more genes in PA and RA genomes in the upper and lower panels, respectively. Histograms on the upper and right margins represent the total number of genes compared in each column and row, respectively. PA – plant-associated, NPA – non-plant associated, RA – root associated, soil – soil-associated. * not a formal class name. Carbohydrates – Carbohydrate metabolism and transport gene category. Full COG category names from the X axis appear in Supplementary Table 6. Note that cells with high absolute estimate values (dark colors) are based on categories of few genes and are therefore more likely to be less accurate.

b 同一分类单元的PA/NPA(顶面板)和RA/土壤(底面板)基因组之间基因类别的差异。
对于两个面板,热图显示了基于GLM测试的富集或耗尽水平。
显色细胞p值<0.05,FDR校正。
热色细胞表明,在上面板和下面板的PA和RA基因组中,分别有更多的基因。
上边缘和右边缘的直方图分别表示每列和每行中比较的基因总数。
PA-植物相关,NPA-非植物相关,RA-根系相关,土壤-土壤相关。
*不是正式的类名。
碳水化合物-碳水化合物代谢和运输基因类别。
X轴的完整COG类别名称见补充表6。
请注意,具有高绝对估计值(深色)的细胞基于少数基因的类别,因此更可能不太准确。

PA和RA基因的鉴定与验证

我们试图确定在PA和RA基因组中富集的特定基因,分别与NPA和土壤来源的基因组进行比较(补充图4,方法)。
首先,我们使用不同的注释资源基于同源性对每个分类单元的蛋白质/蛋白质结构域进行聚类:COG20、KEGG Orthology21和TIGRFAM22,它们通常占细菌基因组中所有基因的35%-75%。
为了在我们的分析中捕获没有现有功能注释的基因,我们还使用了Orthofinder24(遵循基准测试;补充图5)将每个分类单元内的所有蛋白质序列聚类为基于同源性的正交群。
最后,用Pfam25对蛋白质结构域进行聚类(方法见url)。
这五种蛋白质/结构域聚类方法用于平行比较基因组学管道。
每个蛋白质/结构域序列被额外标记为起源于PA或NPA基因组。

接下来,我们使用五种独立的统计方法测试蛋白质/结构域簇是否与PA生活方式显著相关:hypergbin、hypergcn(两种版本的超几何测试)、phyloglmbin、phyloglmcn(两种基于PhyloGLM26的系统发育测试)和Scoary27(一种严格的组合测试(方法))。
这些分析基于基因存在/缺失或基因拷贝数(方法)。
如果一个基因至少通过一个测试属于一个重要的PA基因簇,并且起源于PA基因组,我们将其定义为显著PA(以下简称“PA基因”)。
我们用同样的方法定义了显著的NPA、RA和土壤基因。使用不同方法发现的重要基因簇具有不同程度的重叠(补充图6-7)。
总的来说,我们注意到PA和RA基因之间的高度重叠以及NPA和土壤基因之间的重叠(补充图8)。
总的来说,PA基因从异质分离源的NPA基因组中缺失(补充图9-10)。
使用仅包含来自每种方法的PA和NPA基因的矩阵进行主坐标分析(PCoA),作为特征增加了PA与NPA基因组沿前两个轴的分离(补充图11)。
基于五种聚类技术和五种统计方法,我们为每个分类单元提供了具有统计意义的PA、RA、土壤和NPA蛋白质和结构域的完整列表(补充表7-15,URL)。

在这里插入图片描述
Figure S4. Overview of the algorithm used to call PA and NPA genes (proteins) and gene operons. High quality PA and NPA genomes were collected. All protein and protein domains were retrieved from genomes. Different protein/domain clustering approaches were used based on existing functional annotation (COG, Pfam, TIGRfam, KEGG orthology) or based on running OrthoFinder

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值