pubmedKB:用于探索生物医学文献中生物医学实体关系的交互式web服务器论文笔记

pubmedKB: an interactive web server for exploring biomedical entity relations in the biomedical literature

一、引用

[1] Peng-Hsuan L , Ting-Fu C , Jheng-Ying Y ,et al.pubmedKB: an interactive web server for exploring biomedical entity relations in the biomedical literature[J].Nucleic Acids Research, 2022(W1):W1.DOI:10.1093/nar/gkac310.

二、研究内容

我们提出了pubmedKB,这是一个web服务器,旨在提取和可视化四种生物医学实体类型之间的语义关系:变体、基因、疾病和化学物质。pubmedKB有一个带有交互式语义图的用户友好界面,使用户能够轻松地查询实体和探索实体关系。用高亮显示的片段支持句子可以方便地浏览出版物。pubmedKB结合了一种新的探索性文献挖掘方法和为研究人员提供的交互界面,从而可以快速、智能地搜索大型生物医学文献,从而提供有用的知识和见解。

PubMed基线2022包含大约3300万份摘要。它从期刊和书籍文章中提取的全部摘要用于文本挖掘(图1A)。pubmedKB使用几种NLP和深度学习技术从PubMed摘要中提取四种生物医学实体类型——变体、基因、疾病和化学物质(图1B)。我们使用NLTK进行标记化,并将BiLSTM堆栈在预训练的BioBERT之上。BiLSTM的输出随后被馈送到一个完全连接的网络,该网络做出最终预测。消除由NER模型识别的实体提及的歧义,因为不同的结构可以表示相同的实体(图1C)。使用来自BERN(15)的多类型归一化模型作为我们的NEN模块,将提及链接到已建立的数据库。pubmedKB关系提取(RE)模块包括三个子模块(图1D):关系短语子模块,关系型事实子模块,比值比信息子模块。Neo4j (https://neo4j.com/)为检索关系数据库中两个实体之间的关系提供了有效的机制(图1E)。

pubmedKB关系数据库中的不同实体和不同实体对(无序)

交互界面

pubmedKB有几个限制。首先,用于提取实体信息的语义证据与NLP算法的性能相绑定。其次,使用不一致的生物医学术语和写作风格不仅会导致文档注释不佳,而且还会导致搜索查询与pubmedKB数据库中错误的现有实体相匹配。第三,pubmedKB努力注释大量的PubMed摘要,但是搜索查询可能没有返回结果,要么是因为PubMed文献中没有关系,要么是因为摘要文本中没有提到它。

在未来,我们希望扩展当前的PubMed摘要数据集,以包括PubMed Central全文文章,尽管这将需要在速度和准确性方面提高搜索性能,以应对数据集规模的大幅增加。

pubmedKB是一个开放访问的资源,可以在https://www.pubmedkb.cc/上公开获取。pubmedKB中核心文本挖掘模块的脚本和内部标记句子的数据集可以在GitHub上免费获得https://github.com/jacobvsdanniel/pubmedkb core。

三、知识点

不同实体类型的共现指的是在同一篇文献中,不同种类的生物医学概念(如基因、蛋白质、疾病、药物、生物过程等)同时出现的情况。这种共现信息对于理解复杂的生物医学关系和机制非常有价值。

实体之间的语义关系是指不同实体在特定语境或领域中所具有的相互关联性。在生物医学领域,这些关系对于理解复杂的生物过程、疾病机制、药物作用等至关重要。

几率比(Odds Ratio,简称OR)是一种统计量,用于衡量某一事件与暴露之间的关联强度。它通过比较两组几率来计算:一组是事件发生在暴露组中的几率,另一组是事件发生在非暴露组中的几率。

四、链接

📎pubmedKB an interactive web server for exploring biomedical entity relations in the biomedical literature.pdf

  • 21
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值