基于aspect的情感分析综述 论文翻译笔记 A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges
原文地址:https://arxiv.org/abs/2203.01054
Abstract
对文本讨论的主体或之某一方面的情感的分析是相当重要的细粒度层次的任务,希望在aspect层面上提取人们的意见和想法、尝试去解析句子中涉及到的“某一方面”的情感
为了在不同的场景中能够完成这样的目标,去分析一些情感元素sentiment elements是非常重要的,主要包括 :
- 方面术语aspect term,
- 方面类别aspect category,
- 意见术语opinion term
- 情感极性sentiment polarity
Introduction有图像形式的直观例子,或可查看Background的详细释义
这篇文章的主要任务有:
- ABSA 的各种任务以及相应的解决方案缺乏系统综述,我们补上了
- 提供了一共新的分类方法,它关注情绪元素的“轴线(axes)”,可以很好地emphasize复合类的ABSA任务的变化和进展
- 总结了ABSA任务中预训练语言模型的使用,它将ABSA的性能提高到了一个新阶
- 以及跨领域或跨语言场景中构建更实用的ABSA系统的技术
1-Introduction
1.1 需求
理解在线用户创造的内容中的观点对很多因工程需都很重要,比如电商评论提取情感。显然每天产生的信息很多,设计自动化计算框架来分析这些隐藏在“非结构性文本”后的情绪是很重要的。这也是sentiment analysis和opinion mining出现的原因
1.2 ABSA定义、与传统的不同
传统的情感分析一般只是分析句子或文档整体的一种sentiment polarity——然而这只能是种假设,一段文本不一定只传递一种情感
ABSA被表达情绪的从整个句子或文档转移到文本中的某个实体entity甚至entity的某个方面aspect,它是一种针对这个方面去尝试概述文本表达的opinion的过程,可以为下游应用程序提供有用的细粒度情绪信息
- 比如电商领域的某个特定商品可以看作这样的实体,它的aspect可以是price这种物体也可以是size这种属性。当然这个entity也可以看做是特殊的、general的aspect
- 进一步来讲“披萨很好吃”这一句话中的情感元素分别是“披萨”、“食物”、“美味”和“积极”
- 其中“披萨”和“美味”在句子中明确表达,“食物”和“积极”属于对应的、预定义的类别和情感集
ABSA是在方面级别构建综合意见摘要的过程,它为下游应用程序提供有用的细粒度情绪信息。
1.3 单ABSA
早期的ABSA希望首先分别识别出句子中的每个情绪元素
- 方面词提取任务aspect term extraction task旨在提取给定文本中提到的所有方面词
- 方面情感分类任务aspect sentiment classification task预测句子中特定方面的极性
我们将这些任务称为单 ABSA 任务。尽管它们确实有一定的效果且很流行,但是只是找到单个情感元素的发现对于理解完整的对于该aspect的意见还远远不够——我们需要提取多个情感元素,且找到它们之间的对应性和依赖性
1.4 复合ABSA
为此,近年来引入了几个新的ABSA任务以及相应的基准数据集,以促进【多元素联合预测】的研究。这些任务被称为复合ABSA任务,与仅涉及单一情感元素的单个ABSA任务不同
例如,方面-意见对提取任务以复合形式提取方面及其相关联的意见项,如(pizza, delicious)
这种方式确实能让机器对文本发表opinion的目标和其对应的表述更清晰——但对这类方式的系统研究非常少,本篇希望做补充
1.5 基于预训练语言模型PLMs
BERT、RoBERTa等预训练语言模型给ABSA任务带来了很大的改进,以PLM为骨干的ABSA模型的泛化能力和鲁棒性都得到了显著的提高
甚至只是BERT+堆叠简单线性分类层都比以前专门为端到端ABSA任务设计的最先进的模型效果更好
尽管基于PLM构建ABSA模型已经变得无处不在,但由于发表的时间较短,现有的文献中并没有对其进行讨论。因此,本文对现有的基于PLM的ABSA模型进行了深入的分析,讨论了它们的优点和局限性
1.6 跨语言或跨域ABSA
当前的ABSA模型训练数据和测试数据来自同一分布(例如,同一领域或同一语言)。当数据分布发生变化时,需要根据从新分布中提取的数据重新训练ABSA model,以保证性能。然而,收集额外的大量标记数据非常难,尤其是对aspect level或者说token level的任务
跨域ABSA和跨语言ABSA就能起到很好的补充作用,为推广到不同领域和语言的ABSA系统提供了一种替代解决方案
在本文中,我们还打算回顾近年来解决跨领域和跨语言ABSA问题的工作,这些工作可以通过克服训练数据的限制而产生更实用的ABSA系统
1.7 对其他ABSA任务的评判和总结
总的来说,本文的主要目的是从现代的角度系统地回顾ABSA问题的进展和挑战
我们为ABSA提供了一种新的分类方法,它从相关情感因素的axes上组织各种ABSA研究,重点放在近年来研究的compound ABSA任务上。沿着这一方向,我们讨论和总结了针对每一项任务提出的各种方法。此外,我们还研究了开发用于ABSA问题的预训练语言模型的潜力和局限性。总结了跨领域、跨语言ABSA的研究成果。最后,我们讨论了一些新的趋势和开放的挑战,旨在揭示该领域潜在的未来方向
2-Background
2.1 四种 情感元素
一般的情感分析问题由两个关键部分组成:目标和情感。目标可以是任何实体或实体的一个方面,而情绪可以是对目标表达的正面/中性/负面意见
被分析的目标概括为aspect category和aspect term(方向的类别和方向的短语、术语);情感包含意见表达opinion term情感词和一个普遍的情感倾向,称之为sentiment polarity
- aspect category
c
- 定义了一个实体的一个独特方面,应该属于一个类别集合c,要预先针对所研究的领域进行定义。例如,食物和服务可以是餐厅领域的方面分类
- aspect term
a
- 是在给定文本中明确出现的意见目标,例如,“the pizza is delicious”一句中的“pizza”
- 当目标被隐式表达,即未在句中直接出现(例如,“定价过高!”)时,我们将aspect术语表示为“null”
- opinion term
o
- 表达意见人对目标的看法的词语,例如“披萨很美味”中的“美味”
- sentiment polarity
p
- 描述情绪在一个方面类别或方面术语上的倾向,通常包括积极、消极和中性
2.2 ABSA定义
基于方面的情感分析(ABSA)是针对某一文本项 识别感兴趣的情感元素 的问题,可以是单个情感元素,也可以是它们之间具有dependency关系的多个元素
我们可以根据所涉及的情绪元素组织各种ABSA研究,可以从输入组织也可以冲从输出
- 根据【所需输出】是single sentiment element or multiple coupled elements,我们可以将ABSA任务分为单个ABSA任务和复合ABSA任务。(根据要几个类别的——比如说同时要category和term就是compound)
- 从这个角度出发,我们为 ABSA 提供了一个新的分类法,该分类法系统地从相关情感元素的轴线组织现有的工作
2.3 模型范式
各种nlp领域常见的范式在ABSA都很常用
每个范式都表示处理特定输入和输出格式的通用计算框架。因此,通过将一项任务制定为特定的格式,可以使用相同的范例来解决多个任务。
除了这四种统一的范式以端到端的方式处理任务外,一些复杂的ABSA任务还可以通过流水线(Pipeline)范式来解决,该范式结合多个模型进行最终预测
2.3.1 Sequence-level Classification (SeqClass)
可以理解为句子级别的任务
模型通常首先将输入文本X馈送到编码器Enc(·)以提取特定于任务的特征,随后是分类器CLS(·)以指示标签Y(Y一般可以表示为one-hot或multi-hot向量)
- 在深度学习时代,编码器Enc(·)可以是卷积网络、循环网络或transformer,用于提取上下文语境特征
- 在某些情况下,输入文本X可能包含多个部分,例如,对于方面情绪分类任务,内容和所涉及的特定的aspect都被视为输入。编码器不仅需要提取有用的特征,还需要捕获输入之间的交互
- 分类器 CLS ()通常实现为一个带有池层的多层感知器,来进行分类
2.3.2 Token-level Classification (TokenClass)
主要是实体识别,去做标签labeling或tagging的工作
为输入文本中的每个token分配一个label
- 首先使用编码器 Enc ()将输入文本编码为语境化特征
- 然后使用解码器 Dec ()来预测标签
2.3.3 Machine Reading Comprehension (MRC)
机器阅读理解,MRC根据给定的query Xq从输入文本X中提取连续文本范围
使用MRC范式的ABSA方法需要为相应的任务构造特定于任务的查询
- 例如,在ATE任务中,我们可以将Xq构造为“aspect term是什么?”
- 然后,模型需要提取aspect term的文本跨度
- 它通过预测文本跨度的起始位置ys和结束位置ye产生结果