摘要
- 背景: Paenibacillus属微生物是一种可以作为生物反应器的重要植物根际促生菌。Paenibacillus polymyxa可以促进多种经济作物的生长。我们实验室最近完成了Paenibacillus polymyxa CR1的测序。自2014年1月以来,4种P. polymyxa基因组完成了测序,但比较基因组分析还没有报道。
- 结果: 在本文中,我们完成了4种P. polymyxa的比较基因组分析,其核心基因组表现出显著的保守性。复杂的代谢途径和调控网络的高保守性使P. polymyxa可以快速响应环境变化。负责植物激素合成,溶磷,铁元素获取,转录调控,σ因子,压力响应,转运蛋白,生物质降解相关基因具有高度保守性,表明其与植物宿主和根际具有紧密的联系。除此之外,抗生素抗性基因和非核糖体肽/聚酮化合物合成基因同时出现在每一个菌株的核心基因组和附属基因组中。比较分析揭示了附属基因组的差异,包括M1和SC2菌株中大质粒的存在情况。除此之外,大量的菌株特异性基因和基因岛在每一个基因组中不规则分布。尽管多种植物促生特性被所有菌株编码,只有P. polymyxa CR1编码了在其他Paenibacillus sp.中发现的固氮基因簇。
- 结论: 我们的研究与揭示了宿主互作和生态健康相关的基因位点在P. polymyxa基因组分析中具有高度保守性,而在附属基因组中具有变异性。该工作支撑了P. polymyxa的植物促生功能在很大程度上通过植物激素生产,提升营养可利用性和生物防控机制来调节。该研究为该物种基因组提供了深入的理解,促进了后续的基因工程研究和在农业,工业及制药领域的应用。除此之外,该研究也标明了我们在当前革兰氏阳性菌中复杂植物生物质代谢理解的差距。
背景
- Paenibacillus polymyxa可以生产多种潜在的抗菌和挥发性化合物,这些化合物可以通过营养循环,抑制病原菌和诱导植物防御促进植物健康。
- 最近,我们实验室从讲解的玉米秸秆根际分离一株可以产生大量IAA,并且分泌可抑制多种病原细菌和真菌的挥发性化合物的P. polymyxa CR1。除此之外,CR1具有固氮和促进多种植物生长的能力。有趣的是,CR1可以代谢木质素,纤维素和半纤维素作为单一碳源,并可以将多种植物源化合物发酵为乙醇。
- 2014年1月,4种P. polymyxa基因组完成测序并注释:P. polymyxa E681,P. polymyxa M1,P. polymyxa SC2,P. polymyxa CR1。
- E681于韩国分离,分离自大麦根际
- M1和SC2于中国分离,分别分离自小麦根和辣椒根际
- 全部P. polymyxa菌株都具有生产多种非核糖体肽合成基因簇,编码polymyxins, fusaricidins, paenicidins, gramicidins, bacitracins, polyke- tides, a bacilorin and a lantibiotic.
- P. polymyxa可以编码铁载体,通过提高植物宿主可利用铁并降低病原微生物可利用来铁促进植物生长。
- 这些分析为已经获取,修饰或者在在适应特定环境过程中丢失的基因特征提供了新的理解。
结果和讨论
Phylogenetic analyses
- 我们的结果证实了P. polymyxa与用于微生物肥料的P. mucilaginosus具有直接的关联,与在土壤中独立生存的固氮细菌P. terrae相似度最高。(Figure 1)
General genomic features
- 全基因组基本特征于Table 1中展示。
- 不同的M1和SC2之间CDS差异可能是由于注释方法区别造成的,不同的注释方法可以造成基因组中被注释基因总数的巨大差异。
Conservation of genome architecture
- CR1,E681,M1和SC2染色体使用progressiveMauve进行全局比对,并可视化为LCB图以获取核算水平的P. polymyxa基因组序列相似性(Figure 2)。M1和SC2之间的相似性显著高于组中其他菌株,可以认为两株菌在P. polymyxa系统发育学上形成了一个次级进化枝(Figure 1)。同时,也可以显示出CR1染色体具有许多菌株特异性的低相似区域,其他菌株具有一定差异。
Plasmid encoded genes
- 相比质粒序列,M1和M2基因组序列具有较高的相似性(Table 2和Figure 3)。
- 蛋白质和核酸水平的低同源性与pM1和pSC2中CDS编码大小数量的较大差别有关。
- 为了鉴定质粒的祖源,我们使用tBLASTx与NCBI核酸数据库进行比对,没有发现与任何已知细菌或质粒序列同源。
Functional categorization of theP. polymyxagenomes
- 对比E681和CR1之间及M1和SC2之间在核酸,蛋白质和更能水平的相似性说明其起源于两个次级分组,M1/SC2的祖先在获得特有质粒后发展为两个物种。相反,CR1和E681的祖先在更早的时间点发展成了独立的菌株,给其更多的机会获得独有的特征。
Strain-specific genes
- 4种P. polymyxa蛋白质编码序列的全基因组比对以可视化编码蛋白质的相似性。
- 同源值(Homology values, H-values)被定义为一个用于衡量参比组单个蛋白编码序列与参考组和用户定义组中全部蛋白序列的相似性。
- 我们将用户组定义为所有P. polymyxa的完整序列和它们各自的质粒。H-values <0.41认为是菌株特异性序列,>0.81认为具有保守性,氨基酸水平的相似性阈值分别为<41%和>81%。
- 尽管如此,独有的菌株特异性CDS可能给予细菌未被鉴定的优势特征,使其适应变化的环境。在未来的研究中将鉴定这些菌株特异基因的生态意义。
Horizontally transferred genes
- 外来基因被水平基因转移(horizontal gene transfer, HGT)所获取,通常与插入序列(insertion sequence, IS)元素,tRNA,tmRNA和转座子相关,并使用GC含量差异,密码子偏移,双/三核苷酸差异和GC偏斜鉴定。为了对完整测序的P. polymyxa基因组的整体结构,CDS正负链,RNA基因,转座子,噬菌体相关基因,插入元素,潜在的水平转移位点和序列特异性基因用Artemis注释,病使用DNAPlotter进行可视化(Figure 5)。
- 基因岛(Genomic islands, GIs)被认为是在进化过程中从远源物种中获取的基因元素,如水平基因转移导致的基因组传递和变异。
- 许多GI编码特征提高了包括铁摄入系统,聚酮类化合物合成基因簇,细菌适应性,抗性相关基因,共生基因,异生物质讲解和初级代谢物通路在内的细菌适应性特征。
Plant growth promoting traits
- 参与植物促生和植物源化合物代谢的主要基因在P. polymyxa中高度保守(Table 3),包括吲哚-3-乙酸生产,矿物磷及磷酸盐的溶解和特异性抗菌核糖体肽的合成。这证实了P. polymyxa和根际及内生生态位的联系。
Biological nitrogen fixation
- nif基因簇具有比P. polymyxa基因组(45%)更高的G + C mol% 含量(53.4%),且nif基因簇被Island Viewer鉴定为一个GI,证明了该nif基因簇起源于一个高G + C含量的细菌物种。
- 一个nif基因簇(Figure 7)也在Paenibacillus terrae HPL-003中被鉴定,该物种与P. polymyxa进化关系较接近(Figure 1)。因此,我们认为P. polymyxa和P. terrae具有编码nif基因簇的共同的祖先,并且CR1和HPL-003 nif基因簇在核算水平具有高度相似性。
- 最近的研究表明,从Paenibacillus sp. WLY78获得nif基因簇的Escherichia coli获得了固氮能力。
- CR1中鉴定的9个基因的nif基因簇可能可以作为可转移固氮基因元素促进植物促生菌的基因改造。
IAA production
- 吲哚-3-乙酸(Indole-3- acetic acid, IAA)是一种基本的植物相关微生物合成的内源性生长素,可以通过诱导宿主植物根伸长和分裂,提升有效促进植物的生长和发育。于此同时细菌也可以获得更多来自植物的营养。
- 氨基环丙烷-1-羧酸(Aminocyclopropane-1-carboxylic acid, ACC)是乙烯的直接前体,在压力胁迫下,植物会积累乙烯,进而抑制根延伸并加速落果和植株老化。ACC脱氨酶将ACC转化为氨和α-丁酸盐,从而避免根系生长被抑制,提升植物对于环境的耐受性或来自病原菌的胁迫。
Phosphate solubilization and assimilation
- 在该研究中我们预测的编码葡萄糖-1-脱氢酶和葡萄糖酸脱氢酶基因在全部P. polymyxa基因组中均存在(Table 3),证明磷酸盐溶解的溶解似乎通过葡萄糖酸的分泌调控,且所有菌株都具有溶解矿物磷酸盐的能力。
Antimicrobial compound production
- 细菌通常可以产生抑菌性的的肽和蛋白质(细菌素),抑制周围细菌的生长以提高竞争优势。用于合成非核糖体肽(non-ribosomal peptides, NRP)和聚酮类化合物(polyketides, PK)的酶在自然中通常是模块化的,并且由多个包括腺苷酸化,浓缩,硫醇化和酯化在内的调控结构域构成。
- 全部的P. polymyxa序列没有发现相同的NRP和PK合成基因簇,可能代表了不同菌株对于特定生态位的适应性和与周围生物的竞争关系。
Iron acquisition
- CR1中铁载体合成基因簇与Staphylococcus aureus同源,而M1质粒钟的基因簇则与荧光假单胞菌同源,证明P. polymyxa中铁载体合成基因通过水平基因转移获得。
Biomass degradation and bioproduct formation
- 代谢木质素或者纤维素作为单一碳源的能力反映了P. polymyxa的复杂代谢网络,这使P. polymyxa可以生存在多样的环境中,并定殖于多种植物宿主。
- CR1可利用播啊扩木质素,纤维素和半纤维素在内的多种植物来源的碳源。
- 除此之外,大量糖苷水解酶(glycoside hydrolases,GH)基因家族出现在P. polymyxa基因组中,这与P. polymyxa和含有高浓度植物来源碳的植物宿主根系关系密切一致。
Regulatory network and stress response
- 土壤环境的基质,营养,抗生素和潜在的压力源各不相同,因此,许多植物相关的细菌都有相对较大的基因组,使这些细菌可以在多种环境中生存。
- 大量的预测得到的甲基趋化蛋白(methyl-accepting chemotaxis proteins, MCPs)和σ因子(σ-factors)证明P. polymyxa具有精细的调控能力,使其可以生存在不同的生态位。
Quorum sensing
- 在P. polymyxa中,LuxS是主要的群体感应(Quorum sensing, QS)信号的生产者,然而,复合的双组份蛋白质LuxQ在依赖于LuxS的群体感应菌株的感受器激活和应答调控中扮演了主要的角色。
Transport mechanisms
- 土壤微生物具有大量的ATP结合盒(ATP-binding cassette, ABC)转运蛋白。P. polymyxa是一种典型的可以依赖植物宿主生存或独立生存于根际并且编码多样代谢网络和转运蛋白以适应特定生存环境的微生物。
结论
- 尽管分离于不同的地理环境,并且有不同的宿主植物,在P. polymyxa中包括IAA生产,磷酸盐溶解,植物细胞壁降解,碳源代谢和抗生素生产基因在内的,植物相关和竞争力相关基因高度保守。
方法
- Phylogenetic analyses
- 16S rRNA进化树
- ClustalΩ
序列对齐
- MEGA6
进化树生成
Maximum-likelihood - 全基因组进化树
- PHYLIP
进化树生成
- phyloXML
可视化
- Joint Genome Institute Integrated Microbial Genomes Database
数据库
- 16S rRNA进化树
- Genome analysis
- 基因组注释
- Genebank
数据库
- Artemis
基因注释
- DNAplotter
可视化
- 基因组特征注释(rRNA, tRNA, and CDS)
- Genebank
- tRNAscan
- RNAmmer
- 代谢通路分析
- TandemFinder
- information regarding clusters of orthologous groups(COGs)
- KEGG orthology (KO)
- protein localization and gene ontology
- Joint Genome Institute Integrated Microbial Genomes Database
数据库
- TandemFinder
- 前噬菌体分析
- PHAST
分析软件
- Artemis
可视化
- 插入序列预测
- IS Finder database
- 基因组注释
- 基因岛鉴定
- 水平基因转移
- IslandViewer 2.0
通过GC含量及偏斜推测基因岛
分析包含5个以上的基因/ 或大于4 kb的序列
分析包含噬菌体相关基因
- 水平基因转移
- 比较基因组
- local collinear blocks (LCBs)分析
- Mauve
- progressiveMauve
比对算法
- Genebank
数据库
- Mauve
- 进一步对齐
- MUMmer
- 散点图生成
- JGI IMG database
- 序列特异性基因鉴定
- mGenomeSubtractor
H-value cut-offs
<0.41为特异性序列
<0.8为保守序列
- mGenomeSubtractor
- 植物促生/生物质讲解/溶剂生成基因鉴定
- KO
- tBLASTx
- 代谢/信号通路
- KEGG database
- 转运蛋白编码基因
- BLAST
- Transporter Classification Database
- KO classification
- 非核糖体肽合成基因簇/聚酮类化合物/铁载体合成基因簇/质粒
- anti- SMASH
- 糖苷水解酶/果胶酶/碳水化合物酯酶/碳水化物结合
- CAzY database
- 蛋白质同源性
- BLASTp
- local collinear blocks (LCBs)分析