构建生物医学知识图谱from zero to hero (3):生物医学命名实体识别和链接

本文介绍了生物医学实体链接的重要性,特别是命名实体识别技术在检测文本中的基因、药物、疾病等概念上的应用。通过链接到MESH、CHEBI等知识库,实现实体消歧并丰富图形模型信息。以抗坏血酸为例,展示了如何利用CHEBI数据库增强数据理解。
摘要由CSDN通过智能技术生成

生物医学实体链接

🤓现在是激动人心的部分。对于NLP和命名实体识别和链接的新手,让我们从一些基础知识开始。命名实体识别技术用于检测文本中的相关实体或概念。例如,在生物医学领域,我们希望在文本中识别各种基因、药物、疾病和其他概念。

在这里插入图片描述

生物医学概念提取

在这个例子中,NLP模型在文本中识别了基因、疾病、药物、物种、突变和途径。如前所述,这个过程被称为命名实体识别。对命名实体识别的升级就是所谓的命名实体链接。命名实体链接技术检测文本中的相关概念,并试图将它们映射到目标知识库。在生物医学领域,一些目标知识库是:

  • MESH
  • CHEBI
  • OMIM
  • ENSEMBL
  • and others

为什么我们要将医疗实体与目标知识库联系起来?主要原因是它有助于我们处理实体消歧。例如,我们不希望图中有单独的实体代表抗坏血酸和维生素C,因为领域专家可以告诉你这些是同一件事。第二个原因是,通过将概念映射到目标知识库,我们可以通过从目标知识库中获取有关映射概念的信息来丰富图形模型。如果我们再次使用抗坏血酸的例子,如

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ASKCOS

你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值