最近3篇蛋白质及其组学知识图谱Nature子刊文章解决生物学核心问题

第一篇文章

2022年1月31日Alberto Santos 最新发表在《自然生物技术》上的文章 ” A knowledge graph to interpret clinical proteomics data”. 针对生物医学数据数量大、种类丰富而带来的数据整合困难,该工作提出了一个开源的临床知识图谱平台CKG(Clinical Knowledge Graph), 该平台结合了统计和机器学习算法,加速了典型蛋白质组学工作流程的分析和解释。相比于其他解决方案,CKG平台显得更加友好,将一系列数据库和科学文献信息与omic数据整合到一个易于使用的工作流中,显著增强了科学研究和临床实践的能力。作者开源了相关数据和代码,可以直接迁移到自己的项目中。

 

accc3e5204e93d435f1173fcd983f0a7.png

 

将精准医疗应用到临床决策过程中,取决于整合的多组学数据的情况。但是由于生物医学数据的质量与多样性,以及跨不同生物医学数据库和出版物中的扩展性,对数据集成提出了很高的要求。作者构建了临床知识图谱(CKG),这个开源平台目前包含了2000万个节点和2.2亿个关系。图算法提供了一个灵活的数据模型,当新的数据库可用时,该模型很容易扩展到新的节点和关系。CKG结合了统计和机器学习算法,可加速蛋白质组学工作流程的分析和解释。通过一组proof-of-concept生物标志物研究,作者展示了CKG增强和丰富了蛋白质组学数据,并为临床决策提供了关键信息。

 

4ea53e34a92afe07ef936b01b961d636.png

 

CKG建立在科学的Python库上,具有可靠、可维护性。整个系统是开源的,并取得了MIT许可。它可以在标准工作流程和基于Jupyter笔记本的互动探索中实现可重复、可再现和透明的分析。

 

CKG包括几个独立的功能模块:

(1)格式化和分析蛋白质组学数据(analytics_core);

(2)通过整合来自一系列可公开访问的数据库、用户进行的实验、现有本体和科学出版物的可用数据,构建一个图形数据库(graphdb_builder);

(3)连接和查询这个图形数据库(graphdb_connector);

(4)通过在线报告(report_manager)和Jupyter notebooks促进数据可视化、存储和分析(图1a,b)。这个架构无缝地协调和整合了数据以及用户提供的分析。它还促进了数据共享和可视化,以及基于详细的生物医学知识注释的统计报告的解释,产生了临床相关的结果。

最新3篇发表顶刊蛋白质组学知识图谱相关论文,开源了相关数据和代码第一篇文章2022年1月31日Alberto Santos 最新发表在《自然生物技术》上的文章 ” A knhttps://mp.weixin.qq.com/s?__biz=MzIzOTA2NTQ5NA==&mid=2247484284&idx=1&sn=6c9f4dabad93a2920129a3c5e74f95f0&chksm=e92e8385de590a930ceec855fbc20e2eedd3f4bba238f1c73362aa0a374305bc93ef97f9cca0&token=664256073&lang=zh_CN#rd

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI知识图谱大本营

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值