iMetaOmics | 同济/上海交大-开发支持群体分组分析的宏基因组测序综合分析软件...

点击蓝字 关注我们

OUTPOST:支持群体分组分析的宏基因组测序综合分析软件

61f4b41780fbac4197ba4c1eaaa68683.jpeg

研究论文

● 原文链接DOI: https://doi.org/10.1002/imo2.29

● 2024年9月18日,同济大学李江涛、魏珂联合上海交通大学王晓竹等团队在iMetaOmics在线发表了题为“OUTPOST: a comprehensive analysis software for whole-metagenome shotgun sequencing incorporating group stratification”的文章。

● 本文开发了针对宏基因组鸟枪法测序的综合分析软件OUTPOST,包括14个模块,拥有超过50个功能,为多组实验设计和基于荟萃分析的生物标志物鉴定引入了创新方法。

●  第一作者:周毅航、郑继红、宋文琦

●  通讯作者:王晓竹、李江涛、张超、魏珂

●  合作作者:严欣怡、杜莉、马忠霖、付艳宾、欧阳兆惠、肖宇辰、刘卓群、田丰、黄永瀚、施人豪、梁世康、田鸿磊、刘留

●  主要单位:同济大学附属养志康复医院、上海交通大学、香港大学、香港科技大学、河北工程大学

 亮 点

e45a756464a8336a6e96fd82d78b2a0d.jpeg

●  OUTPOST是一款由Snakemake管理的宏基因组鸟枪法测序综合分析软件,涵盖14个模块,超过50个功能,与现有的17种工具相比,其全面性更为突出;

●  OUTPOST在处理群体分组方面的独特能力使其特别适用于多组实验设计,并为计算扰动研究量身定制;

●  OUTPOST引入了基于元分析的生物标志物识别的创新方法。

摘  要

OUTPOST(the whole metagenOme shotgun seqUencing sTream Pipeline that is cOmprehensive and uSeful for mulTi groups experiments)是一个针对宏基因组鸟枪法测序的综合分析软件,同时包含了群体分组分析。它包括14个模块,拥有超过50个功能,与现有的17种宏基因组鸟枪法测序(whole-metagenome shotgun sequencing,WMGS)工具相比,因其全面性而脱颖而出。OUTPOST为多组实验设计和基于荟萃分析的生物标志物鉴定引入了创新方法。

视频解读

Bilibili:https://www.bilibili.com/video/BV1v5s9e8Ew9/

Youtube:https://youtu.be/QBuHPAVCwqQ

中文翻译、PPT、中/英文视频解读等扩展资料下载

请访问期刊官网:http://www.imeta.science/imetaomics/

全文解读

引  言

微生物组研究领域正在迅速扩展。探索微生物组在人体健康和疾病中的作用能够为精准医学及其治疗应用提供重要见解。尽管rRNA测序为理解微生物组奠定了基础,但全宏基因组鸟枪法测序(Whole Metagenome Shotgun Sequencing,WMGS)代表了微生物组研究中的一项重要进展,能够提供详尽且高分辨率的微生物组分析。这项技术使研究人员能够从多个方面探索微生物组的功能、分类、抗生素反应、环境质量、宿主相互作用以及进行疾病预测。然而,WMGS数据分析劳动密集且计算需求高。这一过程涉及复杂的上游步骤,包括读段和组装的质量控制、基因预测、组装比对和分箱。下游分析同样复杂,涵盖了分类注释和分析、功能注释和分析、多样性和系统发育分析、统计评估、生物标志物识别、抗生素基因分析以及毒力因子和质粒的专项研究。此外,此过程还涉及多种可视化和其他专项分析。随着宏基因组学领域的发展,实验设计变得愈加复杂,研究通常涉及多个不同的组,而不再仅仅是处理组和对照组。分析这些实验所产生的数据要求在每个分析步骤中进行组间比较,进一步增加了分析过程的复杂性。

因此,WMGS数据分析面临两个主要挑战:当前的分析流程缺乏全面性,以及对具有多个组的实验的实际需求支持有限。为了解决WMGS数据分析中的这两大挑战,我们开发了全宏基因组鸟枪法测序软件,即OUTPOST(the whole metagenOme shotgun seqUencing sTream Pipeline that is cOmprehensive and uSeful for mulTi groups experiments)。这是一款旨在提供全面分析并适应多组实验的软件。OUTPOST包含14个模块,其中12个用于分析,另外2个为日志和报告模块。该软件使用户能够为每个样本分配多个组,并在大多数分析中自动进行组间比较,同时具备灵活的输入选项和多样化的输出形式。为了验证OUTPOST的有效性和稳健性,我们对猫肠道微生物组数据集进行了重新分析,成功复现了原始研究中的关键发现。进一步扩展应用时,OUTPOST还被用于哺乳动物肠道微生物组的分析,揭示了杂食性动物与草食性动物之间的显著微生物群差异。此外,OUTPOST还能在治疗背景下应用,成功识别出大量生物标志物和功能性毒力因子。这些结果生成的哺乳动物和人类微生物组组装数据为后续研究奠定了坚实的基础。

结  果

OUTPOST 的全面性出众

OUTPOST包含12个分析模块,涵盖50多个功能,提供20多种可视化类型和大量有条理的表格(图1)。通过精心设计和整合,该工具集成并利用了40多种第三方工具,同时还提供了许多独特功能。与此前的17种宏基因组分析工具或流程相比,OUTPOST的全面性更胜一筹,涵盖了从质量控制到生物标志物分析的广泛分析流程,并且提供了详细的HTML报告。

11349ed71ff809c6a59e90435f1c0c21.jpeg

图1. OUTPOST工作流程的示意图

OUTPOST由14个模块组成。对于每个模块,左侧单元格包含模块名称,中间单元格包含功能摘要,右侧单元格说明输出格式。线条和箭头表示数据流。

OUTPOST的特色功能

专为处理组分层进行软件设计

我们对组分层的处理方式类似于在16S测序中使用的Quantitative Insights Into Microbial Ecology 2 (QIIME2)功能,它处理元数据以分析多组样本。OUTPOST对组分层的适应不是通过单一算法实现的,而是通过贯穿整个软件的工程优化、设计以及付出的大量努力来实现的。

OUTPOST首先评估组分层的适用性,然后自动生成用于分析的成对组合。对于每一对组合,OUTPOST在几乎所有模块的步骤中进行组间比较,包括分类分析、多样性分析、功能分析、线性判别分析、毒力因子分析、质粒分析、抗生素基因分析和生物标志物分析。这些比较不仅涉及统计测试,还包括多层次的计算和可视化,如分布、聚类等。对于单组实验,OUTPOST会自动复制一个相同的组以确保分析的正常进行,这一特性不会对分析结果产生任何影响。

专为计算扰动实验进行软件设计

在宏基因组分析领域,大多数研究通常不会进行扰动研究,而是基于现有的元数据展示结果。这与湿实验室的实践形成鲜明对比。在湿实验室中,敲除实验等方法常用于评估实验结果的稳健性和可信度,这也揭示了宏基因组计算分析中的一个社区性问题。我们建议,宏基因组分析同样可以从扰动实验中受益,特别是在包含组别信息的设计中。如图2A所示,通过将实际分组结果与伪分组结果进行比较,可以评估分析的可靠性。如果两者的结果相似性较高,通常意味着分析的可信度较低;相反,如果结果差异较大,则表明分析的可靠性较高。

OUTPOST特别适合进行计算扰动实验。与大多数宏基因组分析工具不同,OUTPOST考虑了组分层信息,允许每个样本进行多次分组。此外,它还专门设计用于多层次的组间比较,优化了分析工作流程和结果展示。使用我们的工具进行计算扰动研究非常简单,只需在不同的工作目录中并行运行,并使用不同的元数据,而不会增加分析所需的时间。

通过元分析识别生物标志物

宏基因组学研究通常致力于识别与特定表型相关的生物标志物。尽管已经存在许多识别生物标志物的算法,这些算法通常仅依赖单一的信息源,通常是一个计数表。然而,通过文献调研我们发现,大多数宏基因组学研究并不仅仅依赖这些算法来识别生物标志物。相反,它们聚合来自多种分析的结果,通过统计总结来识别在各种分析中始终显著的微生物,作为潜在的生物标志物。这种方法基本上构成了一种元分析。

OUTPOST采用元分析的方法来识别生物标志物(如图2B所示),通过综合来自七种不同类型分析的结果。它根据微生物在每种分析类型中的表现进行评分,并据此进行排名。得分高的微生物被认为更有可能是生物标志物。我们的软件在所有分类层级上进行这种比较,确保识别出的生物标志物在多种分析维度上具有稳健性和一致性。

稳健性

OUTPOST主要在两个方面展现了其稳健性:分析工作流程和操作过程。在分析工作流程的稳健性方面,OUTPOST通过多样化的信息源进行交叉验证,以确保分析结果的可靠性。例如,分类分析结果分别从我们专有的分析流程和宏基因组系统发育分析(Metagenomic Phylogenetic Analysis, MetaPhlAn)中独立得出。即使在相同的方法中,OUTPOST也通过多样化数据源来增强稳健性。例如,它使用物种级别和属级别的计数信息来计算α多样性。在操作过程的稳健性方面,我们的软件通过精心设计来确保其可靠性。OUTPOST使用Snakemake进行工作流程管理,超越了简单脚本调用的限制,并具备断点恢复功能,使得其在处理意外中断时能够继续运行。此外,OUTPOST还自动分配计算资源以提高效率,并持续记录操作数据以便追踪和调试。我们还集成了其他设计元素,这些详细的工程选择共同增强了流程的操作稳健性。

baf7e2640eaf1caa3c16f196f9f48018.jpeg

图2. OUTPOST的特色功能

(A)使用OUTPOST进行计算扰动实验的示意图。(B)基于荟萃分析的OUTPOST生物标志物识别和经典生物标志物识别算法的示意图。

OUTPOST在三个案例中的应用及验证

OUTPOST已在三个不同的宏基因组学项目中应用,以展示其在不同环境中的实用性和可靠性。在案例1中,我们重新分析了一个现有的猫肠道微生物组数据集。我们的重新分析识别出正常猫和肥胖猫之间的微生物群落分布差异。此外,还检测到与肥胖相关的特定代谢途径和分类群。这些发现大体上与原始研究一致,同时为猫肠道微生物组分析提供了额外的见解。在案例2中,OUTPOST用于一个包含多组别的哺乳动物肠道微生物组数据集。分析结果确认了该工具处理复杂实验设计数据集的能力,计算扰动实验验证了OUTPOST分析的准确性,并有效推断出区分杂食性和草食性动物微生物组的生物标志物。在案例3中,我们评估了一个人类肠道微生物组数据集,比较了结直肠肿瘤样本与健康样本,这相比案例1具有更大的医学意义。OUTPOST识别出与结直肠肿瘤相关的潜在细菌标志物和毒力因子,包括大肠杆菌中的entD基因。这些案例研究的方法和结果的详细说明可以在补充材料中找到。

讨  论

OUTPOST通过增强分析功能的广度并整合组分层信息来弥补WMGS数据分析中的空白。它包含14个模块,集成了超过40个第三方工具,提供了50多种功能。OUTPOST能够处理每个样本的多个组,支持在八个分析模块中进行详细的自动化比较。该软件设计了创新功能,用于计算扰动实验和通过元分析识别生物标志物,从而增强了分析的稳健性和实用价值。然而,它并不旨在涵盖所有可能的WMGS数据分析任务,由于新方法的不断涌现,这是几乎不可能实现的。它也不打算深入开发任何特定的分析功能,因为这超出了OUTPOST的预期目标。该软件源于WMGS研究的实际需求,致力于涵盖广泛的常见分析任务,特别关注多组实验设计和生物标志物的识别。

我们相信,OUTPOST可以为从初学者到高级研究人员以及具有不同计算专业知识水平的用户提供宝贵的帮助。对于不熟悉计算的用户,OUTPOST充当WMGS分析环境的安装程序。通过遵循软件网站上的教程,用户只需一行代码即可部署包含40多个常用第三方工具的环境,从而节省了通常所需的大量时间和精力。对于大多数用户而言,OUTPOST是WMGS数据分析的门户,允许执行超过12个分析模块,包括基于元分析的独特生物标志物识别功能,而无需担心多组实验设计的复杂性。此外,用户也无需担心解读大量结果,因为该流程会生成详细的注释报告。在出现错误时,软件的断点恢复功能可将时间损失降至最低。高级用户将发现,我们基于Snakemake的框架提供了灵活性和可扩展性,使他们可以通过修改Snakefile来扩展OUTPOST的功能。此外,OUTPOST能跟踪每个任务的计算资源使用情况,有助于识别并解决耗时的瓶颈问题。此外,OUTPOST不依赖于第三方工具,允许高级用户在我们的流程环境中设计自己的分析工作流程。

OUTPOST也有其局限性。例如,它不包括与分箱相关的分析,因为我们认为分箱是一种独立且复杂的分析,需安装大量数据库,而像MetaWRAP(Metagenomic Workflow for Read-based Assembly, Binning, and Annotation)这样的工具已经充分解决了这一问题,使得OUTPOST无需整合分箱功能。为继续改进,增强批次效应消除是潜在的下一步目标。目前,我们受HUMAnN(HUMAnN: The HMP Unified Metabolic Analysis Network)启发的批次效应去除方法是通过分组的CPM(Counts Per Million,每百万读段计数)来标准化计数。开发一种更有效的WMGS(Whole Metagenome Shotgun,宏基因组鸟枪法测序)批次效应去除算法可以进一步标准化该领域的分析。

代码和数据可用性

OUTPOST代码是公开的,可以在GitHub上找到,同时可以在https://github.com/Y-H-Joe/OUTPOST上找到相应的教程,也可以在Zenodo (https://doi.org/10.5281/zenodo.11091729)上找到教程、示例和结果。我们使用的 WMGS数据可以从NCBI(美国国家生物技术信息中心)下载。

HTML报告的示例可在(https://github.com/Y-H-Joe/OUTPOST/blob/main/example_data/Data_S1_OUTPOST_report_example.7z) 上找到。补充信息(方法、图表、表格、幻灯片、视频、中文翻译版和更新材料)可以在iMeta Science http://www.imeta.science/imetaomics/中找到。

引文格式

Yihang Zhou, Jihong Zheng, Wenqi Song, Xinyi Yan, Li Du, Zhonglin Ma, Yanbin Fu, Zhaohui Ouyang, Yuchen Xiao, Zhuoqun Liu, Feng Tian, Jason Wing Hon Wong, Jen Hao David Shih, Shikang Liang, Honglei Tian, Liu Liu, Ke Wei, Chao Zhang, Jiangtao Li, Xiaozhu Wang. 2024. OUTPOST: a comprehensive analysis software for whole-metagenome shotgun sequencing incorporating group stratification. iMetaOmics e29. https://doi.org/10.1002/imo2.29

作者简介

6610adda44d3757e0a87624c73bf2a60.jpeg

周毅航(第一作者)

● 同济大学博士。

● 目前方向为计算生物学。

f457e0a26b39cf52e977a01b9a90b88a.jpeg

郑继红(第一作者)

● 同济大学博士。

● 目前方向为单细胞测序的跨物种分析。

609e7309585d6afda4acbf1d32cf0672.jpeg

宋文琦(第一作者)

● 同济大学博士。

● 目前方向为单细胞测序的跨物种分析。

96fcd44dab54a9e554c73f1813c54f5e.jpeg

王晓竹(通讯作者)

● 上海交通大学医学院,助理研究员。

● 研究方向为比较基因组学,单细胞多组学和生物信息学。

ce5f14eb131554e67838204c31f41a90.jpeg

李江涛(通讯作者)

● 同济大学海洋与地球科学学院教授,博士生导师。

● 研究方向为海洋微生物生态。

698414d89b3687dad8b76764ea80d60f.jpeg

魏珂(通讯作者)

● 同济大学教授,博士生导师。

● 研究方向为干细胞与再生生物学。

iMetaOmics

更多资讯

●  iMeta姊妹刊iMetaOmics(定位IF>10)欢迎投稿!(2024.2.27)

●  iMeta姊妹刊iMetaOmics编委招募 (定位IF>10) (2024.3.2)

●  iMeta姊妹刊iMetaOmics电子版和印刷版ISSN申请获批(2024.4.1)

●  iMeta姊妹刊iMetaOmics投稿系统正式上线(2024.4.17)

●  iMeta姊妹刊iMetaOmics主编正式官宣(2024.4.22)

● 出版社iMetaOmics主页正式上线!(2024.4.28)

● iMetaOmics | 浙江大学宗鑫组揭示两猪种宿主-肠道菌群互作差异

● iMetaOmics | 罗鹏/袁硕峰/苗凯/程全发表STAGER: 生成式人工智能可靠性的标准化测试和评估推荐

● iMetaOmics | 徐州医科大杨欢组揭秘沙门氏菌-宿主-微生物群在免疫与代谢中的相互作

● iMetaOmics | 中科院动物所金坚石组综述16S rRNA基因扩增子测序技术的“前世今生”

● iMetaOmics | 浙大张天真组完成二倍体棉种泛基因组构建

● iMetaOmics | 张勇/李福平-先进糖蛋白组学在男性生殖研究中的潜在应用

● iMetaOmics | 暨南大学潘永勤/杨华组-炎症蛋白联合检测利于诊断甲状腺乳头状癌和结节性甲状腺肿

● iMetaOmics | 张开春组利用多组学方法揭示甜樱桃加倍后果色变化的候选基因

● iMetaOmics | 杜娟/林婷婷-慢性泪囊炎患者眼部菌群类型和纵向菌群变化

● iMetaOmics | 陈汉清/陈俊综述有关肝细胞癌治疗的新兴纳米医学策略

● iMetaOmics | 基因组所刘永鑫/卢洪评述微生物在提高杂种优势中的作用

● iMetaOmics | 上科大刘雪松组开发基于通路的肿瘤细胞鉴别工具TCfinder

● iMetaOmics | 中山大学刘鹏/邹宇田-整合人工智能实现HER2阳性乳腺癌精准管理

● iMetaOmics | 安徽农大李晓玉组-丛枝菌根真菌对玉米内生菌群的影响

● iMetaOmics | 徐涛/黄蓉/苏国海-急性冠脉综合征纵向多组学队列建设

● iMetaOmics | 通过整合宏组学促进人类与环境健康发展

● iMetaOmics | 苏州大学林俊组-揭示活性微生物及益生元/益生菌与关节炎联系

● iMetaOmics | 中国药科大学徐文波开发叶绿体基因组数据分析软件

 iMetaOmics | 清华刘晓组和复旦王久存组揭示特定细菌在皮肤老化中的作用

iMetaOmics | 中南大学夏晓波团队揭示青光眼和SLE发病机制新关联

iMetaOmics | 庐山植物园刘芬组揭示了自噬在植物-根微生物互作机制中的调控作用

iMetaOmics | 杨瑞馥/袁静综述微生物组与“同一健康”的联系

更多推荐

(▼ 点击跳转)

高引文章 ▸▸▸▸

iMeta | 引用14000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据

a39799698efec6c5cbc796dc1a6c3aec.png

高引文章 ▸▸▸▸

iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法

f027ab3ebe7d45277340689fca65f036.png

高引文章▸▸▸▸

iMeta | 高颜值绘图网站imageGP+视频教程合集                                        

1c0e81a3dc4ec88571dd31bbfe110ed4.png

8d60cb03db31d1f8c2783047810356dc.jpeg

1卷1期

42a9c21357ff88c610b07502494b04d5.jpeg

1卷2期

c4060bad9e6545c8b648a57ae4f95920.jpeg

1卷3期

57aace5d2cd2514cbbd86faf4ef12734.jpeg

1卷4期

48f0bdea6277fa74d9a624785ca8aff0.jpeg

2卷1期

784c48b21cd5edbf7d98bf9be9d6c52a.jpeg

2卷2期

72dc388e0986a5d3aec5d218e2aaead7.png

2卷3期

b852d32662b60e098a23d6fdec2f91c9.jpeg

2卷4期

a7fb286448932bbca4f046296829df27.png

3卷1期

99a5d71cdc1fae587753c3266d147246.png

2卷2期封底

7ab52046405627dd2a6ba580e12463a1.jpeg

2卷4期封底

8f9323c7982ddadea3f8b3e562604710.jpeg

3卷2期

c19cc2d25dee9e09c5356c2e7ab5bfe2.png

3卷3期

af734321130acb8db0ce60f320d9e6c4.jpeg

3卷3期封底

c933c38ba93dad29b749183802f720ac.jpeg

3卷4期

89a402e95649428d0af7483e84137c84.png

3卷4期封底

af818394eef3fa279482327c3b978786.png

1卷1期

期刊简介

iMeta” 是由威立、肠菌分会和本领域数百千华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!发行后相继被Google Scholar、ESCI、PubMed、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.7,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,同学科研究类期刊全球第一,中国大陆11/514!

iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!

iMeta主页:

http://www.imeta.science

姊妹刊iMetaOmics主页:

http://www.imeta.science/imetaomics/

出版社iMeta主页:

https://onlinelibrary.wiley.com/journal/2770596x

出版社iMetaOmics主页:

https://onlinelibrary.wiley.com/journal/29969514

iMeta投稿:

https://wiley.atyponrex.com/journal/IMT2

iMetaOmics投稿:

https://wiley.atyponrex.com/journal/IMO2

邮箱:

office@imeta.science

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值