指代消解简介(Co-reference Resolution)

定义

指代消解指在文本中确定代词指向哪个名词短语的问题

简单介绍

我们还是先举个例子:

今天晚上10点有国足的比赛,他们的对手是泰国队。在过去几年跟泰国队的较量中他们处于领先,只有一场惨败1-5。

指代消解要做的就是分辨文本中的他们指的到底是国足还是泰国队
通常我们为了解决类似的问题,需要准备好一些训练数据,用监督学习模型去处理。
类似于在上面的例子中,我们将第一个他们和第二个他们分别标记为A和B,将“国足”和两个泰国队分别标记为①②③
然后设计training data:

  1. 提取每个词与词的特征
    可以提取上下文、词性之类的作为特征
  2. 特征提取完后,标记label,1为有关系,0为没有关系
datalabel
X(A①)1
X(B①)1
X(A②)0
X(B②)0
X(A③)0
X(B③)0
  1. 获得上述训练数据后,可以建立模型

在新的文本中,需要判断代词指的是哪个名词的时候,只要将对应代词与名词抽取的特征放入模型做预测即可,提取其中概率最大的值作为真实名词的语义。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值