不服就干!FEAST微生物溯源:一场微生物“寻根究底”的浪漫之旅

图片

微生物一直处于不断变化的状态,估计不同源微生物群落(source,“源”)对特定微生物群落(sink,“汇”)的贡献或混合比例被称为微生物溯源(MST)问题。了解样本中这些生物体来自何处以及如何形成群落,探清微生物的源头对于理解微生物群落构建机制、优先效应以及生物安全是很必要的。

图片

图1 微生物的“汇”和“源”分析

快速准确的微生物来源分析一直是微生物的难点之前常用随机森林和基于贝叶斯的SourceTracker有较广泛应用,但运行速度和准确度一直不尽人意。2019年,由加州大学洛杉矶分开发的新的方法FEAST Source Tracker[1],可以实现快速、更准确的微生物来源追踪。该软件基于R语言开发,保证了方法跨平台的可用性。

图片

图2 使用Feast和SourceTracker的厨房柜台样品中未知来源的比例分析

A. 来源估计,考虑到12个已知的人类来源(四个居民的手、脚和鼻子)。B. FEAST估计第一时间点一个家庭厨房柜台微生物来源,使用来自地球微生物组项目的额外来源数据。

凌恩开发了

图片

图片

针对肠道、土壤、水体、食品等样本,可以同时快速估计多个样本潜在的多个源环境的贡献,从而帮助解开复杂微生物群落/功能基因的起源。

溯源样品

肠道、土壤、水体、食品等

溯源对象

(sink)

细菌/古菌/病毒等

ARG/MGE/MRG/VFs/KEGG/元素循环等功能基因

源环境

(source)

溯源样品周围的环境(如肠道、土壤、空气、水体等)

凌恩应用FEAST软件对多种测试数据进行了溯源分析,获得了良好结果,部分结果如下:

图片

图3 植物根际土壤中微生物来源占比

图片

图4 肉类表面微生物抗性基因来源占比

研究示例  

2024年最新发表于《Sci Total Environ》的冰川宏基因组,分析了从北极冰川和青藏高原冰川到下游水生态系统的 ARG和病毒传播,来识别ARGs、病毒及其宿主的多样性和分布,追踪ARGs和病毒的来源,以及确定推动ARG和病毒传播的环境影响因子。

图片

图5 冰川抗性宏基因组和宏病毒组[2]

研究基于宏基因组数据鉴定出921个抗生素抗性基因(ARGs),属于22个抗生素类别。在北极冰川和青藏高原冰川中,ARGs的丰度和多样性均高于其下游生境。所有生境中有31个病毒家族,其中32.52%可以被分类到已知科,主要是PhycodnaviridaeKyanoviridae

通过FEAST识别源-汇系统中ARGs和病毒的潜在传播途径,发现有72个ARGs(17.39%)和3个病毒科(13.64%)在北极冰川和北冰洋生境之间共享。在青藏高原冰川、青海湖和长江流域之间有14个ARGs(1.82%)和4个病毒科(19.05%)共享。在北极冰川和北冰洋共享的ARGs中,有86.50%在北极冰川中的丰度高于北冰洋。在高原冰川、青海湖和长江流域之间共享的ARGs中,有57.10%在高原冰川中的丰度高于青海湖。在源-汇系统中,不同生境之间ARG和病毒丰度的降低可能表明了ARGs和病毒从丰度高的生境传播到丰度较低的生境。

图片

图6 溯源分析和环境因子对ARG丰度的影响[2]

再来看一篇2022年发表于《Nature Communicatons》的文献,分析了玉米植物的木质部中具有可固氮的高度保守的核心细菌微生物群落,该类固氮细菌能为玉米提供氮营养,类似人类的 “肠道细菌群” 。

图片

图7 玉米植物的木质部中具有可固氮的高度保守的核心细菌微生物群落[3]

本文发现茎木质部选择性地招募了以Gammapproteobacteria为主的高度保守的微生物。结果表明,携带固氮酶基因(nifH)的细菌类群在茎木质部的比例大于根和叶等其他器官。在木质部汁液中发现的25个核心细菌分类群中,确认几种分离的菌株是活性固氮或协助生物固氮。

作者使用快速期望最大化微生物源跟踪(FEAST)来跟踪植物细菌微生物组的潜在来源。宿主对从表面到内部的栖息地中微生物群落的组成模式表现出强烈的选择作用。例如,内生菌RE中60.61%的微生物组来自根际土壤RS。木质部汁液VE充当地上和地下部分之间的媒介,其24.21%的细菌微生物组来自RE。

图片

图8 土壤-植物holobiont的玉米细菌群落组成[3]

参考文献

[1]FEAST: fast expectation-maximization for microbial source tracking. Nature Methods, 2019.

[2]Metagenomic analysis of antibiotic-resistance genes and viruses released from glaciers into downstream habitats. Science of the Total Environment, 2024.

[3]A highly conserved core bacterial microbiota with nitrogen-fixation capacity inhabits the xylem sap in maize plants. Nature communications, 2022.

  • 21
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Python的feast是一个用于特征存储和管理的开源库。下面是一个使用feast的示例: 首先,我们需要准备一些特征数据。假设我们正在开发一个电商推荐系统,我们想要使用用户的浏览历史和购买记录作为特征。我们可以定义一个“user_features.csv”文件,其中包含用户的ID、浏览历史和购买记录。类似地,我们可以定义一个“product_features.csv”文件,其中包含产品的ID、价格和品类等特征。 接下来,我们可以使用feast来创建一个特征实体。我们可以使用命令行工具或编程接口,使用以下代码创建一个新的特征实体: ```python import feast # 创建一个feast客户端 client = feast.Client() # 创建一个特征实体 client.apply_entity_from_csv(entity="user", entity_source="user_features.csv", schema="user_id:int64, view_count:int64, purchase_count:int64") client.apply_entity_from_csv(entity="product", entity_source="product_features.csv", schema="product_id:int64, price:double, category:string") ``` 我们定义了两个特征实体,一个是用户(user),一个是产品(product)。通过定义它们的名称、来源和模式,我们可以让feast知道如何加载和管理这些特征。 接下来,我们可以定义一个特征集(FeatureSet)。特征集是一个包含多个特征的集合,可以用来训练模型或进行推断。以下是一个使用feast定义特征集的示例: ```python # 创建一个特征集 client.apply_feature_set(feature_set="user_view_stats", features=["user.view_count", "user.purchase_count", "product.price"], entities=["user", "product"], batch_source="user_features.csv", stream_source="user_clickstream", schema="user_id:int64, view_count:int64, purchase_count:int64, price:double") ``` 在上述示例中,我们定义了一个名为“user_view_stats”的特征集。它包含了用户的浏览次数、购买次数以及产品的价格特征。我们还指定了特征集的实体(即用户和产品),以及特征集的数据来源(批处理和流处理)。 通过以上步骤,我们成功地创建了特征实体和特征集,并使用feast进行特征管理和存储。在实际使用feast时,还可以通过feast的查询接口获取特征数据,并进行模型训练或推断等操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SHANGHAILINGEN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值