Entity linking 2

Candidate Entity Ranking

两种排序方式:

  • Supervised ranking methods
  • unsupervised ranking methods

Features

两种feature

- context-independent features
Simply check weather the mention and the entity label in the KB match:
- exact matching
- dice coefficient(系数/协同) score
- hemming distance

- context-dependent features 需要读取实体上下文
entity popularity: 选一个最常见的释义
entity type: NER可以返回给定词的broad type (person, organisation, location…). 通过判断type的配对来确定含义。

bag of words (BOW)
all words in the doc that contains the entity mention and match with the words associated to the entity
concept vectors
从给定文章中可以提取出key-phrases, anchor text, named entities. 用这些features来创建vector来代表实体和释义。它们之间的相似度可以用cosine similarity和jaccard similarity来进行计算。
coherence between mapping
在一篇文章里,实体和一到两个主题是一致的
可以通过计算两个实体和两个释义的相关度来进行计算。在Wikipedia中我们可以通过计算有多少篇文章关联向同一对实体。

Supervised ranking methods

Binary classification methods

输入<mention, entity>, 我们可以训练一个classifier返回1或0来判别mapping是否准确。
eg. SVM, Naive Bayes Classifiers

probabilistic methods

除了用classifier,我们还可以用概率模型来表示准确度

Unsupervised ranking methods

Graph based approaches
AIDA system: entity-mention and entity-entity relations as a graph. 每一条边都代表实体释义可能性的权重

find a subgraph where only one entity-mention edges with max weight. NP-hard (greedy algorithm)

VSM based models (vector space model)
获取好的训练数据困难又很贵
只计算释义和备选实体间的相似度

Unlinkable mention prediction

ignore the problem.
如果备选项为零,假定实体不可连接
use a threshold value on the ranking score
train a binary classifier
add NIL as special entity. 如果NIL得分最高,则认为实体不可连接

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值