文章概述
方面情感三元组提取(ASTE)旨在从评论句子中识别方面及其相应的意见表达和情感,是细粒度意见挖掘中的一项新兴任务。 ASTE 由多个子任务组成,包括意见与实体提取、意见与实体关系检测和情感分类,因此适当地捕获和利用它们之间的关联是至关重要且具有挑战性的。
作者将ASTE任务转化为一个多轮阅读理解(MTMRC)任务,并提出了一个双向 MRC (BMRC) 框架来应对这一挑战。具体来讲,作者设计了三种类型的查询,分别为限制性查询、非限制性查和情感分类查询,以建立不同子任务之间的联系。此外,作者考虑到三元组既可以来自于一个方面也可以来自于一个意见的表达,作者设计了一个双向MRC框架。一个方向依次识别aspect、opinion和sentiment,而另一个方向识别的顺序为opinion、aspect、sentiment,并通过将两个方向联合从而可以更全面的识别三元组。
方法
查询构造
A→O方向的非限制性抽取查询和限制性抽取查询如下:
(1)A→O non-restrictive extraction query:“问出”句子中所含有的所有aspect;
(2)A→O restrictive extraction query:构建方式为“What opinions given the aspect a ”即这时候的意见是限制针对于目前aspect的。
O→A方向的非限制性抽取查询和限制性抽取查询对应如下:
(1)O→A non-restrictive extraction query:“问出”句子中所有的意见词;
(2)O→A restrictive extraction query:构建方式为 “What aspect does the opinion o describe?“这时候要去发现每个意见词是修饰哪一个aspect的。
根据上面说得到的aspect-opinion对,构建情感分类查询来对面向方面的情感进行分类:“What sentiment given the aspect a and the opinion o ”。
模型构造
作者所构造的模型如下图所示:
即通过两个方向的MRC分别提取aspect→opinion,和opinion->aspect,最后再通过一个MRC预测相应方面的情感。
模型训练
作者这里采用的训练的方式是3个模型的loss叠加共享参数。
非限查询loss如下:
限制查询loss如下:
情感分类的loss如下:
最后将上述损失函数结合起来,形成整个模型的损失目标:
两个方向的问题融合
这里利用了条件概率的相关知识,即首先求出两个集合的交集(说明此时aspect-opinion对肯定存在),然后求两个集合差集,求出剩余的aspect-opinion对的概率(softmax函数),如果概率大于所给定的阈值,那么也有理由相信这个方面-意见对也是存在的。
总结
这篇文章通过构造多轮外加双向MRC解决情感分析中的ASTE任务,不需要过于复杂的标注和计算,按照作者自己再文中写的就是“优雅”,而且该篇文章也给出了代码,适合进一步学习。
文章地址:https://arxiv.org/abs/2103.07665