基于aspect的情感分析综述 论文翻译笔记 A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

基于aspect的情感分析综述 论文翻译笔记 A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

原文地址:https://arxiv.org/abs/2203.01054

Abstract

对文本讨论的主体或之某一方面的情感的分析是相当重要的细粒度层次的任务,希望在aspect层面上提取人们的意见和想法、尝试去解析句子中涉及到的“某一方面”的情感

为了在不同的场景中能够完成这样的目标,去分析一些情感元素sentiment elements是非常重要的,主要包括 :

  • 方面术语aspect term,
  • 方面类别aspect category,
  • 意见术语opinion term
  • 情感极性sentiment polarity

Introduction有图像形式的直观例子,或可查看Background的详细释义

这篇文章的主要任务有:

  • ABSA 的各种任务以及相应的解决方案缺乏系统综述,我们补上了
  • 提供了一共新的分类方法,它关注情绪元素的“轴线(axes)”,可以很好地emphasize复合类的ABSA任务的变化和进展
  • 总结了ABSA任务中预训练语言模型的使用,它将ABSA的性能提高到了一个新阶
  • 以及跨领域或跨语言场景中构建更实用的ABSA系统的技术

1-Introduction

1.1 需求

理解在线用户创造的内容中的观点对很多因工程需都很重要,比如电商评论提取情感。显然每天产生的信息很多,设计自动化计算框架来分析这些隐藏在“非结构性文本”后的情绪是很重要的。这也是sentiment analysis和opinion mining出现的原因

1.2 ABSA定义、与传统的不同

传统的情感分析一般只是分析句子或文档整体的一种sentiment polarity——然而这只能是种假设,一段文本不一定只传递一种情感

ABSA被表达情绪的从整个句子或文档转移到文本中的某个实体entity甚至entity的某个方面aspect,它是一种针对这个方面去尝试概述文本表达的opinion的过程,可以为下游应用程序提供有用的细粒度情绪信息

  • 比如电商领域的某个特定商品可以看作这样的实体,它的aspect可以是price这种物体也可以是size这种属性。当然这个entity也可以看做是特殊的、general的aspect
  • 进一步来讲“披萨很好吃”这一句话中的情感元素分别是“披萨”、“食物”、“美味”和“积极”
    • 其中“披萨”和“美味”在句子中明确表达,“食物”和“积极”属于对应的、预定义的类别和情感集

fig 1 例子

ABSA是在方面级别构建综合意见摘要的过程,它为下游应用程序提供有用的细粒度情绪信息。

1.3 单ABSA

早期的ABSA希望首先分别识别出句子中的每个情绪元素

  • 方面词提取任务aspect term extraction task旨在提取给定文本中提到的所有方面词
  • 方面情感分类任务aspect sentiment classification task预测句子中特定方面的极性

我们将这些任务称为单 ABSA 任务。尽管它们确实有一定的效果且很流行,但是只是找到单个情感元素的发现对于理解完整的对于该aspect的意见还远远不够——我们需要提取多个情感元素,且找到它们之间的对应性和依赖性

1.4 复合ABSA

为此,近年来引入了几个新的ABSA任务以及相应的基准数据集,以促进【多元素联合预测】的研究。这些任务被称为复合ABSA任务,与仅涉及单一情感元素的单个ABSA任务不同

例如,方面-意见对提取任务以复合形式提取方面及其相关联的意见项,如(pizza, delicious)

这种方式确实能让机器对文本发表opinion的目标和其对应的表述更清晰——但对这类方式的系统研究非常少,本篇希望做补充

1.5 基于预训练语言模型PLMs

BERT、RoBERTa等预训练语言模型给ABSA任务带来了很大的改进,以PLM为骨干的ABSA模型的泛化能力和鲁棒性都得到了显著的提高

甚至只是BERT+堆叠简单线性分类层都比以前专门为端到端ABSA任务设计的最先进的模型效果更好

尽管基于PLM构建ABSA模型已经变得无处不在,但由于发表的时间较短,现有的文献中并没有对其进行讨论。因此,本文对现有的基于PLM的ABSA模型进行了深入的分析,讨论了它们的优点和局限性

1.6 跨语言或跨域ABSA

当前的ABSA模型训练数据和测试数据来自同一分布(例如,同一领域或同一语言)。当数据分布发生变化时,需要根据从新分布中提取的数据重新训练ABSA model,以保证性能。然而,收集额外的大量标记数据非常难,尤其是对aspect level或者说token level的任务

跨域ABSA和跨语言ABSA就能起到很好的补充作用,为推广到不同领域和语言的ABSA系统提供了一种替代解决方案

在本文中,我们还打算回顾近年来解决跨领域和跨语言ABSA问题的工作,这些工作可以通过克服训练数据的限制而产生更实用的ABSA系统

1.7 对其他ABSA任务的评判和总结

总的来说,本文的主要目的是从现代的角度系统地回顾ABSA问题的进展和挑战

我们为ABSA提供了一种新的分类方法,它从相关情感因素的axes上组织各种ABSA研究,重点放在近年来研究的compound ABSA任务上。沿着这一方向,我们讨论和总结了针对每一项任务提出的各种方法。此外,我们还研究了开发用于ABSA问题的预训练语言模型的潜力和局限性。总结了跨领域、跨语言ABSA的研究成果。最后,我们讨论了一些新的趋势和开放的挑战,旨在揭示该领域潜在的未来方向

2-Background

2.1 四种 情感元素

一般的情感分析问题由两个关键部分组成:目标和情感。目标可以是任何实体或实体的一个方面,而情绪可以是对目标表达的正面/中性/负面意见

被分析的目标概括为aspect category和aspect term(方向的类别和方向的短语、术语);情感包含意见表达opinion term情感词和一个普遍的情感倾向,称之为sentiment polarity

  • aspect category c
    • 定义了一个实体的一个独特方面,应该属于一个类别集合c,要预先针对所研究的领域进行定义。例如,食物和服务可以是餐厅领域的方面分类
  • aspect term a
    • 是在给定文本中明确出现的意见目标,例如,“the pizza is delicious”一句中的“pizza”
    • 当目标被隐式表达,即未在句中直接出现(例如,“定价过高!”)时,我们将aspect术语表示为“null”
  • opinion term o
    • 表达意见人对目标的看法的词语,例如“披萨很美味”中的“美味”
  • sentiment polarity p
    • 描述情绪在一个方面类别或方面术语上的倾向,通常包括积极、消极和中性

2.2 ABSA定义

fig 2

基于方面的情感分析(ABSA)是针对某一文本项 识别感兴趣的情感元素 的问题,可以是单个情感元素,也可以是它们之间具有dependency关系的多个元素

我们可以根据所涉及的情绪元素组织各种ABSA研究,可以从输入组织也可以冲从输出

  • 根据【所需输出】是single sentiment element or multiple coupled elements,我们可以将ABSA任务分为单个ABSA任务和复合ABSA任务。(根据要几个类别的——比如说同时要category和term就是compound)
  • 从这个角度出发,我们为 ABSA 提供了一个新的分类法,该分类法系统地从相关情感元素的轴线组织现有的工作

2.3 模型范式

fig3

各种nlp领域常见的范式在ABSA都很常用

每个范式都表示处理特定输入和输出格式的通用计算框架。因此,通过将一项任务制定为特定的格式,可以使用相同的范例来解决多个任务。

除了这四种统一的范式以端到端的方式处理任务外,一些复杂的ABSA任务还可以通过流水线(Pipeline)范式来解决,该范式结合多个模型进行最终预测

2.3.1 Sequence-level Classification (SeqClass)

可以理解为句子级别的任务

模型通常首先将输入文本X馈送到编码器Enc(·)以提取特定于任务的特征,随后是分类器CLS(·)以指示标签Y(Y一般可以表示为one-hot或multi-hot向量

  • 在深度学习时代,编码器Enc(·)可以是卷积网络、循环网络或transformer,用于提取上下文语境特征
  • 在某些情况下,输入文本X可能包含多个部分,例如,对于方面情绪分类任务,内容和所涉及的特定的aspect都被视为输入。编码器不仅需要提取有用的特征,还需要捕获输入之间的交互
  • 分类器 CLS ()通常实现为一个带有池层的多层感知器,来进行分类
2.3.2 Token-level Classification (TokenClass)

主要是实体识别,去做标签labeling或tagging的工作

为输入文本中的每个token分配一个label

  • 首先使用编码器 Enc ()将输入文本编码为语境化特征
  • 然后使用解码器 Dec ()来预测标签
2.3.3 Machine Reading Comprehension (MRC)

机器阅读理解,MRC根据给定的query Xq从输入文本X中提取连续文本范围

使用MRC范式的ABSA方法需要为相应的任务构造特定于任务的查询

  • 例如,在ATE任务中,我们可以将Xq构造为“aspect term是什么?”
  • 然后,模型需要提取aspect term的文本跨度
  • 它通过预测文本跨度的起始位置ys和结束位置ye产生结果
2.3.4 Sequence-to-Sequence

  • 4
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
情感分析是一种通过计算机程序对文本中的情绪进行分析的技术。方面的使用生成对比学习方法。生成对比学习是一种通过比较两个不同视角的数据来提高模型性能的方法。在这种情感分析中,我们可以使用生成方法来自动提取文本中的情感方面,并结合对比学习方法来提高模型的性能。通过这种方法,我们可以更准确地识别文本中不同方面的情感,并且能够更好地区分出正面和负面情绪。 在这个过程中,我们首先使用生成模型来自动提取文本中的情感方面,然后结合对比学习方法来进行训练,以提高模型对情感方面的识别能力。这种方法可以帮助我们更准确地理解文本中的情感内容,并且能够更好地适应不同类型文本的情感分析任务。 此外,我们还可以使用这种方法来进行情感方面的生成,并结合对比学习方法来训练模型,使得生成的情感方面能够更接近真实的情感内容。通过这种方法,我们可以生成更加准确和自然的情感内容,并且能够更好地适应不同类型的情感生成任务。 综上所述,generative aspect-based sentiment analysis with contrastive learning and exp的方法可以帮助我们更准确地识别和生成文本中的情感内容,并且能够更好地适应不同类型文本的情感分析和生成任务。这种方法在自然语言处理领域具有广阔的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值