代谢组学的飞速发展,尤其是分析技术的进步、样本数量的增加、样本类型的多样化以及多检测平台的联合应用,使代谢组数据在数量和复杂性上急剧增加。这个时候,代谢数据库便应运而生!
代谢研究数据库是专门存储和提供有关代谢物、代谢途径、代谢相关蛋白质以及代谢组学数据的在线资源。
它们通常包含关于代谢物(细胞或生物体内产生的小分子化合物)、代谢途径(代谢物之间的化学反应序列)、酶(催化代谢反应的蛋白质)、以及代谢组学研究数据(通过高通量技术获得的代谢物的定量信息)等内容。
本文主要介绍以下代谢数据库:
1.Human Metabolome Database (HMDB)
网址:https://www.hmdb.ca/
HMDB是一个专注于人类代谢组的数据库,提供了关于小分子代谢物(代谢组)的详细化学、生物化学和生理数据。它包括有关代谢物的化学结构、生物途径、疾病关联、药物反应、基因表达数据以及质谱和核磁共振光谱数据。HMDB的数据可以免费访问,并且定期更新。
目前最新版本HMDB4.0包含114100代谢物、5498条疾病链接、3840 NMR实验图谱、22198 MS/MS实验质谱图和7418 GC-MS实验质谱图。另有几千到数万个代谢物预测的NMR或MS谱图。相较于以前版本,4.0版新增了6777个代谢物—SNP互作关系,2497个代谢物—药物互作关系和18192个代谢反应。此外,HMDB支持多种搜索方式,包括化合物名字搜索、分子量搜索、分子结构搜索和二级质谱搜索。
但该库目前不支持批量搜索,仅限于单个代谢物搜索,搜索效率较低。另外,该库也不支持代谢通路搜索、代谢化合物浓度搜索等功能。
2. MolAid化合物智能检索平台
网址:https://rxn.molaid.com/
MolAid收录全球数以亿计的化学品数据,提供精准数据信息,包括物化性质、吸收、分布、代谢、排泄、毒理性、反应、文献、晶体、谱图、安全等信息数据。支持查询化合物、了解物质性质、寻找购买信息、查询反应条件、设计反应路线、谱图查询、预测性质及谱图等,实现合成实验全场景覆盖。
MolAid收录了药物的吸收、分配、代谢、排泄和毒性信息,以科学实验为导向为药物设计和药物筛选提供数据支撑。
3. The Small Molecule Pathway Database (SMPDB)
网址:https://smpdb.ca/
SMPDB是一个生物信息学资源,它提供了一个集中的平台,用于查看、搜索和下载小分子代谢途径的详细图形表示。这些途径包括代谢物、蛋白质和酶的相互作用,以及它们在特定生物过程中的作用。SMPDB的目标是为研究人员提供一个全面的、用户友好的代谢途径数据库。
SMPDB特别为临床代谢组学、转录组学,蛋白质组学和系统生物学中通路阐释和通路发现而设计。SMPDB提供了巧妙详细地人类代谢通路、代谢疾病通路、代谢物信号通路和药物活性通路的超级链接图表。每个小分子和人类代谢组数据库(HMDB)或DrugBank中包含的详细描述进行超链接,而每个蛋白质或酶复合物和UniProt进行超链接。
该库方便浏览,并支持全文搜索。用户能够用一列代谢物名字、药物名字、基因/蛋白质名字、SwissProt ID,Affymetrix ID或Agilent微阵列ID来查询SMPDB。这些查询将产生一列匹配的通路,并在每个通路图表中高亮显示匹配的分子。基因、代谢物和蛋白质浓度数据也可以通过SMPBD的映射界面进行可视化。所有SMPDB的图像、图像映射、描述和表都是可下载的。
4. Kyoto Encyclopedia of Genes and Genomes (KEGG)
网址:https://www.kegg.jp/
KEGG是一个综合性的生物信息数据库,包括基因组、生物途径、疾病、药物和化学物质等多个方面的信息。在代谢方面,KEGG提供了详细的代谢途径图,以及与这些途径相关的酶和化合物信息。KEGG的数据被广泛应用于系统生物学、生物化学和药物研究中。
目前KEGG已包含18个部分,17268种代谢物和460条通路,整合了基因组、化学、系统功能和健康信息。将已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能进行关联是KEGG数据库的特色之一。与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,使研究者能够对其所要研究的代谢途径有一个直观全面的了解。
5. MetaboLights
网址:https://www.ebi.ac.uk/metabolights/
MetaboLights是由欧洲生物信息研究所(EMBL-EBI)维护的一个公共代谢组学数据库。它提供了一个开放的存储和共享平台,用于实验代谢组学数据和相关的元数据。数据库支持代谢组学研究的可重复性和透明性,用户可以上传、搜索和分析数据。
6. Reactome
网址:https://reactome.org/
Reactome是一个免费的、开源的生物途径数据库,提供了详细的代谢和信号传导途径信息。它涵盖了人类、小鼠、大鼠、斑马鱼和秀丽隐杆线虫等物种的途径。Reactome的数据是由专家策划的,并提供了丰富的可视化工具,用于探索和下载生物途径信息。
7. The Golm Metabolome Database (GMD)
网址:http://gmd.mpimp-golm.mpg.de/
GMD)是一个全面的数据库,专注于基于质谱的代谢组学数据。它由德国戈尔姆马克思普朗克分子植物生理研究所开发并维护。GMD旨在作为一个参考数据库,用于识别和注释生物样本中的代谢物,尤其是植物样本。
8. LIPID MAPS
网址:https://www.lipidmaps.org/
LIPID MAPS是一个专注于脂质研究的数据库,提供了关于脂质的详细信息,包括它们的分类、结构、生物学功能和代谢途径。数据库提供了一个搜索工具,允许用户根据脂质的类型、名称和其他属性进行搜索。LIPID MAPS是脂质组学研究的重要资源。
代谢数据库对于归纳总结大数据、提高数据的使用率、进行深层次的交叉分析以及揭示隐藏在大数据背后的生物学机理都有重要的作用。
这些数据库对于系统生物学、药物发现、疾病机理研究、营养学和环境科学等领域的研究具有重要价值。