实体链接维基百科调研

本文概述了实体链接消歧的基本概念,重点介绍了如何通过语言学规则和维基百科匹配生成候选实体集,以及实体链接映射表的构建。深入讲解了候选实体集合的生成步骤,并提到了候选集消歧的方法和后续学习内容,如实体链接Wikipedia库的应用实例。
摘要由CSDN通过智能技术生成

略微整理一下关于实体链接消歧的入门知识
本篇是关于论文【张佐亮 “基于维基百科的实体链接方法的研究与实现”】的内容记录


实体链接定义

  实体链接消歧不仅能够将不同的待消歧命名实体指称区分幵,而且能够显示出待消歧命名实体指称的确切含义。实体链接消歧研宄是随着大规模的语义知识库的出现而发展起来的。实体链接消歧方法需要借助于外部知识库(比如维基百科),将待消歧命名实体指称链接到知识库中的对应实体,这样就可以唯一确定待消歧命名实体指称的含义,从而达到消歧目的。

歧义性:一是语言的一词多义性,同一个实体指称项在不同语境下可以表示不同实体概念;二是多词一义性,同一个实体概念可能有多个不同实体指称项表述,如全称、缩写、昵称等。


一、实体链接步骤

注:在命名实体识别之后

  1. 候选实体集合的生成,即确定某个实体指称在实体知识库中的候选实体;
  2. 对候选实体集合的消岐,以确定该实体指称在实体知识库中对应哪个真实实体概念。

二、实体链接细节

1.候选集合生成


候选实体集合生成方式:

(1)语言学规则匹配。
  对英文文献进行缩写词匹配,例如“short for”、“also called”等这些短语,认为文本中这些词组之后的实体概念为待消歧实体的候选实体,生成候选实体集合。<

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值