**
ABSA-《Aspect-Category-Opinion-Sentiment Quadruple Extraction with Implicit Aspects and Opinions》论文阅读记录
**
背景及摘要:
产品评论包含大量隐含的方面和观点,然而在以往的研究中隐式方面和观点一直没有得到重视,在现有的基于方面的情感分析研究大多忽略了这一问题。
本文中提出了一个新的任务,称为Aspect-Category-Opinion-sentiment(ACOS)四元组提取任务,目标是在一个评论句子中提取所有Aspect-Category-Opinion-Sentiment四元组,以此来支持从评论中挖掘更多的隐含方面和观点。
此外作者构建了两个新的数据集来适应这项任务,Restaurant-ACOS 和 Laptop-ACOS。两个数据集都包含了四元组抽取和隐含的aspects 和 opinions。作者还尝试用四个baseline系统对任务进行测试。实验证明了新任务的可行性及其在提取和描述ABSA中的隐式方面和隐式观点的优势。
介绍:
方面级情感分析的核心任务是从产品评论中提取方面和描述方面的opinions,并判断方面的情感极性。方面级情感分析包含许多子任务:aspect-sentiment extraction ,aspect-opinion extraction ,aspect-opinion-sentiment triple extraction和aspect-category-sentiment等。
但是目前大多数现有的研究都只能实现显式 aspects和opinions 的抽取,而忽视了评论中implicit aspects和opinions。我们从下表中可以清晰地看到评论中implicit aspects和opinions占比。
ABSA四大要素
一个四元组抽取的例子如下:例如surface是一个方面项,smooth是方面项对应的观点,design是方面项的类别,positive是相应的情感。第1个是一个显式的四元组提取;第2个是包含隐式方面的四元组,第3个是包含隐式观点的四元组。
ACOS四元组抽取任务主要会面临下面两个挑战:
①就目前而言,没有包含所有隐式aspects和opinions的aspect-category-opinion-sentiment 四元组抽取可用的数据集。
②该任务包括两个提取问题(方面提取、观点提取)和两个分类问题(类别分类、情感分类),如何构建模型去整合这四个子任务是一个挑战。
本文贡献:
1.引入了一个名为Aspect-Category-Opinion-Sentiment Quadruple Extraction的新任务,以解决ABSA中隐含的方面和观点问题;
2.构建了两个新的数据集,并对隐式方面和观点做了注释;
3.使用了四个基线对任务做了基准测试,实验证明了新任务在解决隐含方面/观点问题方面的优势。
任务定义:
在本文中为了方便起见,使用方面、类别、观点和情感分别表示方面术语、方面类别、观点术语和情感极性。其定义如下:
方面类别观点情感(ACOS)四元组提取被定义为:
ACOS四元组提取任务不仅识别四个元素,还将它们组合成一组有效的四元组,同时考虑隐式方面和观点。由于隐式方面或观点没有明确表示为单词或短语,在隐式的情况下将其设置为空。
方法:
四种基线:
-(1) Double-Propagation-ACOS:
Double Propagation (DP)是一种aspect-opinion-sentiment三元组抽取的基于规则的方法之一;分两步完成四元组抽取任务:首先遵循DP算法提取方面意见情感三元组,然后再将得到的aspect进行分类,从而得到ACOS四元组。再进行分类时遵循以下策略:如果三元组中的方面在训练集中,将其最共现的方面类别作为最终的方面类别;否则采用输入评论句子中最近方面的方面类别作为最终方面类别。
-(2)JET-ACOS:
JET模型是aspect-opinion-sentiment三元组抽取任务的最新方法之一(目前已不是了),JET(Xu等人,2020年)通过将方面识别、其相应观点和情感极性与位置感知标记模式相结合,为这项任务引入了端到端框架。首先基于JET获得候选方面观点情感三元组,设计一个基于BERT的模型来获得提取的三元组的方面类别。
给定评论句子r,传给BERT模型,以获得上下文感知标记表示H:
其中hr=[h1,…,hn]是r的输出表示。
根据给定提取的三元a-o-s,将方面和观点表示为Ua=avg(ha)和Uo=avg(ho),其中avg(ha)和avg(ho)分别是方面ha和观点ho中词的平均向量。然后将Ua和Uo连接起来,对于每个类别c,将其送到全连接网络中,经过 Sigmoid函数得到分类结果。
给定a-o-s和c,yc=1表示有效的四元组,而yc=0表示无效四元组。
-(3)TAS-BERT-ACOS:
TAS-BERT(Wan等人,2020)是方面类别情感三元组提取的较好方法之一。适应ACOS任务:
首先通过TAS-BERT模型得到候选 category c、sentiment s、aspect。给定一个评论句子r,类别c∈ C、 和一种情绪s∈ S、 输入构造如下:
然后将x传给BERT模型以获得上下文感知标记表示H:
其中hr=[h1,…,hn]是r的输出表示,hcs是c和s串联的输出表示,h[CLS]用于category-sentiment验证。
然后通过将H建模为单个序列标记任务,在H上执行方面意见共同提取。
将hr输入到CRF层,以提取r中关于输入类别c和情感s的方面和观点:
将分类的结果和之前抽取的三元组进行笛卡尔积运算,得到候选四元组。
其中|A|和|O|是提取的方面和意见的数量,|C|和|S|是检测到的类别和情绪的数量。
最后将aspect和opinion的向量进行平均,然后将它们的串联[ua;uo]传送=入到四重过滤器,判断是否有效,得到最终的四元组。
-(4)Extract-Classify-ACOS:
实现步骤:
第一步在评论句中抽取aspect-opinion二元组,第二步预测给定提取的方面观点对的category-sentiment。模型:
首先在评论句r的开头和结尾插入两个[CLS]标记,然后将转换后的输入传给给BERT,以获得上下文感知标记表示H
对于explicit aspect-opinion,使用CRF来完成。其中使用h[CLS]来判断是否存在implicit aspect or opinion。可以获得潜在方面集SA、意见集SO,并对SA和SO执行笛卡尔积,以获得一组候选方面意见对:
对于每个类别c,将每个方面意见对a-o的平均向量连接起来,并将它们提供给具有Softmax函数的完全连接层:
数据集:
实验结果:
个例实验: