Bidirectional Machine Reading Comprehension for Aspect Sentiment Triplet Extraction
南开大学 AAAI 2021
论文地址: https://arxiv.org/pdf/2103.07665.pdf
代码地址: https://github.com/NKU-IIPLab/BMRC
1. 摘要
1.1 任务描述&建模
方面情感三重提取 (ASTE
) 旨在从评论句子中识别方面及其相应的观点表达和情感(at, op, sp)
。
本文将 ASTE 任务转换为多轮机器阅读理解 (MTMRC) 任务,并提出了一个Bidrectional-MRC (BMRC) 框架来应对这一挑战。设计了三种类型的查询,包括非限制性提取查询
(第一轮查询)、限制性提取查询
(第二轮查询可以理解为给定方面/意见术语查询另一个术语)和情感分类查询
(第三轮查询),以建立不同子任务之间的关联。
1.2 前两轮查询时分为双向的
目的是为了抽取(at, op)
对
正向:
第一轮抽取方面术语Aspect Term,第二轮根据方面术语抽取意见术语Opinion Term
反向:
第一轮抽取意见术语Opinion Term, 第二轮根据意见术语抽取方面术语Aspect Term
1.3 第三轮
通过得到的前两轮得到(at, op)
对进行情感分类得到情感极性Sentiment Polarity,以获得(at, op, sp)
三元组
2. 介绍
ASTE 任务的示例。方面、意见表达和情感分别用红色、蓝色和绿色标记
3. BMRC模型架构
第一轮:非限制性提取查询
设计查询 “ What aspects?
”来提取方面术语的集合 A = {at}
第二轮:限制性抽取查询:
设计查询 “ What opinion given the aspect at
? ”来提取相应的意见术语, 对于每个方面 术语 并形成(at, op)
对。
第三轮:情感分类查询
设计查询“ What sentiment given the aspect ai and the opinion {ops}
? ”
判断每个(at, op)
对的情感极性。得到三元组(at, op, sp)
3.2损失计算
输入构建:{[CLS], qi,1, qi,2, ..., qi,|qi|, [SEP], x1, x2, ..., xN}
第一轮:非限制性查询Loss(这里是双向损失)
第二轮: 限制性提取查询Loss(这里是双向损失)
第三轮:对于情感分类查询,我们最小化交叉熵损失函数Loss如下:
整个模型的损失目标:
我们利用两个二元分类器来预测答案跨度,每个token进行开始/结束二分类
4. 实验结果
5.总结(贡献)
- 将方面情感三重提取 (ASTE) 任务形式化为多回合机器阅读理解(MTMRC)任务。基于这种形式化,我们可以在一个统一的框架中优雅地识别方面情感三胞胎。
- 提出了一个双向机器阅读理解(BMRC)框架。通过设计三回合查询,我们的模型可以有效地建立意见实体提取,关系检测和情感分类之间的关联。
- 我们在四个基准数据集上进行了广泛的实验。实验结果表明,我们的模型达到了最先进的性能。