两消两现指的是_指代消解两个经典工作

最新推荐文章于 2023-12-03 14:35:25 发布

乐正昶

最新推荐文章于 2023-12-03 14:35:25 发布

阅读量836

点赞数

本文链接：https://blog.csdn.net/weixin_29617841/article/details/113690870

版权

两消两现指的是

Outline：Manning研究线

Span ranking model线

第一部分 Manning and Clark研究线(2016)

1. Deep Reinforcement Learning for Mention-Ranking Coreference Models

这篇文章解决问题：强化学习思想用在Mention-Ranking Model 中。

1.1Baseline模型：

指代消解模型一般可以分为两个阶段：第一阶段先找出文章中我们需要找到的Mention。第二阶段对所有找到的Mention分成一簇一簇，一簇就是不同的Mention指代了相同意思的集合。

在文章中假设已经通过某种算法对文本进行了Mention的抽取。所以只讨论第二阶段。

Mention-Ranking定义了一个序列问题，假设m个mention，遍历m个mention，在每个mention上计算当前mention的每个先行词组成一个pair的向量表达，如图：

再过一个：wx + b 的layer可以轻松得到一个分数，最后选一个最大的分数的pair，说明mention和这个先行词是我们找的一对共指。

如图如果遍历到了x3上，分别计算他的先行词x1, x2和他组成pair(x1, x3),(x2, x3)的分数，然后取最大的作为一对共指。

loss function：

这里红框中的是mi和先行词组成pair中分数最大的。

$equation?tex=%5C%28%5CDelta_%7Bh%7D%5Cleft%28c%2C+m_%7Bi%7D%5Cright%29%5C%29$ 公式如下：

是一个衡量不同错误所受惩罚的权重系数，实验中有一个固定的最好值：

$equation?tex=%5C%28%5Cleft%28%5Calpha_%7B%5Cmathrm%7BFN%7D%7D%2C+%5Calpha_%7B%5Cmathrm%7BFA%7D%7D%2C+%5Calpha_%7B%5Cmathrm%7BWL%7D%7D%5Cright%29%3D%280.8%2C0.4%2C1.0%29%5C%29$

然后梯度更新这个loss。

1.2 加入强化学习改进

文章中提到两种方法的改进：Reward Rescaling 和 The REINFORCE Algorithm

Reward Rescaling:

其实就是改进了Baseline model loss function的

$equation?tex=%5C%28%5CDelta_%7Bh%7D%5Cleft%28c%2C+m_%7Bi%7D%5Cright%29%5C%29$ 这个衡量不同错误大小的权重系数，在这里使用了强化学习中reward的定义，值得一提这里的reward使用了指代消解的一个评测方式

$equation?tex=%5C%28B%5E%7B3%7D%5C%29$ 来定义，

$equation?tex=%5C%28%5CDelta_%7Bh%7D%5Cleft%28c%2C+m_%7Bi%7D%5Cright%29%5C%29$ 公式：

$equation?tex=%5C%28%5Cbegin%7Baligned%7D+%5CDelta_%7Br%7D%5Cleft%28c%2C+m_%7Bi%7D%5Cright%29%3D%26-R%5Cleft%28a_%7B1%7D%2C+%5Cldots%2C%5Cleft%28c%2C+m_%7Bi%7D%5Cright%29%2C+%5Cldots%2C+a_%7BT%7D%5Cright%29+%5C%5C+%26%2B%5Cmax+_%7Ba_%7Bi%7D%5E%7B%5Cprime%7D+%5Cin+%5Cmathcal%7BA%7D_%7Bi%7D%7D+R%5Cleft%28a_%7B1%7D%2C+%5Cldots%2C+a_%7Bi%7D%5E%7B%5Cprime%7D%2C+%5Cldots%2C+a_%7BT%7D%5Cright%29+%5Cend%7Baligned%7D%5C%29$

直接意思：如果mention i 选择了先行词c作为一对共指，看看奖励总数和去掉他的奖励总数差距多少，差距小就是影响小，证明这个错误是个小错误，相应权重系数也小。

The REINFORCE Algorithm：

整个过程模拟强化学习：

action:

待续

参考文献：

Improving Coreference Resolution by Learning Entity-Level Distributed Representations

Deep Reinforcement Learning for Mention-Ranking Coreference Models

乐正昶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
两消两现指的是_指代消解两个经典工作

Outline：Manning研究线Span ranking model线第一部分 Manning and Clark研究线(2016)1. Deep Reinforcement Learning for Mention-Ranking Coreference Models这篇文章解决问题：强化学习思想用在Mention-Ranking Model 中。1.1Baseline模型：指代消解模型一般...
复制链接

扫一扫