斯坦福CS224n NLP课程【十五】——共指解析指代消解

最新推荐文章于 2022-05-10 11:08:28 发布

桐原因

最新推荐文章于 2022-05-10 11:08:28 发布

阅读量1.4k

点赞数 1

分类专栏：斯坦福CS224n NLP 文章标签：神经网络机器学习人工智能深度学习 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36287702/article/details/109044049

版权

斯坦福CS224n NLP 专栏收录该内容

18 篇文章 1 订阅

订阅专栏

Coreference Resolution

指代消解是什么？

找出文本中名词短语所指代的真实世界中的事物。比如：

不只是代词能够指代其他事物，所有格和其他名词性短语也可以。甚至还存在大量嵌套的指代：

应用：

全文理解：完整的文章中有大量的指代
机器翻译：土耳其语不区分男他和女她，翻译到英文的时候必须做指代消解；当然了，当前工业线上的MT系统大多做不了
文本摘要：使用代词会使行文更加自然
信息提取和QA系统：比如搜索“谁娶了Claudia Ross”，出来“He married Claudia Ross in 1971”，则系统必须消解“He”是谁。

评估Conference Evaluation

指代消解的结果很像聚类，所以一些聚类的评测手段可以借用：

利用准确率和召回率来进行评估

当然实际中问题可能更复杂一些，有多个类别，而且gold cluster如何与produced cluster二分图匹配也是个NP问题（实际应用中有一些贪婪的算法效果也还不错）。

代指的类型：

这个分类是语言学家定的，在NLP领域没见到过，顶多见到“回指”和“共指”。

不是所有的nlp都在指代

绿色NP“指代”全集或空集，描述的是一种普遍规律。红色等价于绿色，所以也不是在做指代。

Coreference 、anaphors、cataphors

NLP领域关注的其实只有上述3种指代类型的前2种，中文应当译作“共指”和“回指”，最后一种是“回指”的反义词：

上图中，一般视作“共指”处理。

那为什么回指不视作共指处理呢？因为两者在许多时候并不等效：

在NLP领域，也很少研究这种bridging anaphora，后一个“票”视作另一种实体的指代，并不学习其与“演唱会”的关系。

共指与回指：

是两种不同的概念

回指中，后一个实体指代前一个实体，但两者并非指代真实世界中同一个事物。那是不是应该区别对待它们呢？事实上，实际应用的系统几乎无法区分它们。

指代消解的方法：

传统代词消解方法: Hobbs naive algorithm

这是Hobbs手工写的规则集，在句法树上运作。有两页的规则，类似地摊杂志上的心理算命：“如果……那么跳转第几步……否则……”该算法根据英文语言上的直觉编写，可以拿到80%的准确率，有时候也作为其他机器学习分类器的特征之一使用。

基于知识库的指代消解

Winograd和其他旧派AI学者认为，要做指代消解，必须有一个外部的知识库。比如：

根据常识，害怕暴力的更可能是女性，所以上述两个they的指代各不相同。这种“知识库”可能帮助系统消歧。 Winograd等人的“知识库”连Hobbs的基线算法都没有达到。

几种指代消解模型

Mention Pair models：将所有的指代词（短语）与所有被指代的词（短语）视作一系列pair，对每个pair二分类决策成立与否。

Mention ranking models：显式地将mention作为query，对所有candidate做rank

Entity-Mention models：一种更优雅的模型，找出所有的entity及其对话上下文。根据对话上下文聚类，在同一个类中的mention消解为同一个entity。但这种方法其实也用得不多。

监督Mention-Pair Model

这种模型用得最多，每个mention与之前的mention做二分类决策，当然如何识别mention是另外一个问题。

指代消解可用特征:

大量语言学特征，人肉特征工程可用：

神经网络指代消解模型

虽然直觉上，联合学习所有mention之间的指代关系肯定比单个二分类要好，global比local肯定要好。但实际上没有试验数据能够支撑这一点，所以虽然有global RNN等更强大的模型，效果最好的依然是mention-pair或mention-ranking模型。

首先找到所有的mention：

这些mention可能属于两个不同的类别，但模型并不知道。模型如果混淆了这两个类别，则是一个差劲的模型。然后为每个mention与之前的mention建立pair，让模型打分：

这里的NEW表示my是一个独立的mention，不与构成共指或回指。最终得到：这里不同的聚类之间没有指代关系。

神经Mention-Pair Model 网络架构

简单的前馈网络，输入是一些词嵌入与少量人工特征。

特征：虽然免不了一些手工特征，但数量已经降到非常少了。

训练：这个模型的架构稀松平常，重点在于训练方法。我们不是简单地认为所有决策都是同等重要，而是认为有些决策很重大不能失误，而另一些决策无关紧要。比如：

第一个错误联通了连个不相干的entity聚类，所以是致命的。而第二个错误中，蓝色it其实是孤立的、不指代任何事物，所以无关紧要。

这种决策重要性的不同带来了强化学习的舞台。

强化学习来rescue

有一些旧的工作尝试启发式地分配不同的决策以不同的权重，但做这件事的最佳方案是RL。虽然没有巨大的进步，但的确有一些效果提升。RL以是否能得到较好的cluster为最终目标，据此评价每个独立决策。

错误类型：之前的工作部分可以复用：

其中，第三种错误是最坏的

训练时为不同的错误分配不同的惩罚系数，以最大间隔损失函数乘上惩罚系数作为最终的损失函数。

这些惩罚系数需要人工指定，也未必与badness直接相关，所以Kevin等人想到用RL来代替它。

强化学习：将每个mention-pair视作一个action，在action序列上建模：

激励函数利用B3来设计：

训练：

一共探索出了两种算法：

1.REINFORCE 算法将mention-pair模型的打分softmax成概率，最大化决策序列的奖励期望。

由于决策序列有指数级种，所以会用到一些采样算法。但该算法存在一个很严重的问题，所有决策序列的奖励期望是提高了，但我们真正想要的是让得分最高的那一个决策序列的分值尽量高。

2.Reward-Rescaling算法不再人工指定惩罚系数：

而是用当前决策序列下，改动某一个决策所带来的奖励的下降来作为惩罚系数。比如黄金序列的奖励是100：

改动一个决策，得到奖励的减少量：

在此基础上再改动一个，得到：

总之利用regret值作为损失函数的缩放因子。

结果：

神经网络（2016）比非神经网络要多1个百分点，RL再带来零点几个百分点。

神经网络模型能够捕捉一些语义近似而用词不同的指代（比较常见）：

而RL实际上犯了更多的错误，但它擅长不犯致命错误：

Reward-Based Costs 优点：

事实上，RL得到的cost反映出其方差是非常大的。启发式cost往往选取密度最大的那个值，但不适用于大多数情况：

而且所有mention的分布并不一定代表某种mention的cost分布：

重视这种灵活性，让RL少犯了特定类别的错误：

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
斯坦福CS224n NLP课程【十五】——共指解析指代消解

Coreference Resolution指代消解是什么？找出文本中名词短语所指代的真实世界中的事物。比如：不只是代词能够指代其他事物，所有格和其他名词性短语也可以。甚至还存在大量嵌套的指代：应用：全文理解：完整的文章中有大量的指代机器翻译：土耳其语不区分男他和女她，翻译到英文的时候必须做指代消解；当然了，当前工业线上的MT系统大多做不了文本摘要：使用代词会使行文更加自然信息提取和QA系统：比如搜索“谁娶了Claudia Ross”，出来“He married ..
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。