Aspect Based Sentiment Analysis总结(一)——任务和数据

转载: Aspect Based Sentiment Analysis总结(一)——任务和数据
https://zhuanlan.zhihu.com/p/81513782

基于方面的情感分析(Aspect Based Sentiment Analysis, ABSA)[1]是一种细粒度的情感分析任务,旨在识别一条句子中一个指定方面(Aspect)的情感极性。一个句子中可能含有多个不同的方面,每个方面的情感极性可能不同。基于方面的情感分析有很多实际应用价值,如针对商品评论的基于方面的情感分析可以提取用户对一个商品不同部分/方面的评价,为厂商进一步改进商品提供更细粒度的参考。

基于方面的情感分析(ABSA)中的方面(Aspect)可以指显式出现在句子中的一个实体(Target, Aspect term)或者隐式表达的一个描述事物的角度(Aspect category)。

在这里插入图片描述

基于方面的情感分析ABSA主要包括以下四个子任务:

1.Aspect term的情感分类

一个Aspect term是句子中的一个词或词组,如上图中的decorfood。句子中针对decorfood这两个Aspect term的情感是不同的,Aspect Term Sentiment Analysis (ATSA)作为ABSA的一个子任务,目的是识别句子中一个指定Aspect term的情感极性,可以建模为一个分类问题。

2.Aspect category的情感分类

一个Aspect category是句子中隐式表达的描述事物的一个预先定义的角度。如上图中的句子从ambience和food这两个角度来描述一个餐馆。Aspect category来自一个预先定义好的集合,其不必显式地出现在句子中。Aspect Category Sentiment Analysis (ACSA)作为ABSA的另一个子任务,目的是识别句子中一个指定Aspect category的情感极性,也可以建模为一个分类问题。

另外两个ABSA的子任务分别是Aspect Term Extraction和Aspect Category Extraction。

3.Aspect Term Extraction

Aspect Term Extraction旨在抽取出一个句子中的Aspect term,可以建模为一个序列标注问题。

4.Aspect Category Extraction

Aspect Category Extraction旨在识别出一个句子中从哪些预先定义好的Aspect category角度描述事物,可以建模为一个多标签分类问题(multi-label classification)。

数据集

目前绝大多数发表在ACL,EMNLP和NAACL上的ABSA相关论文实验中使用的数据集是SemEval 14 Restaurant/Laptop Review数据集Twitter数据集。此外,最近公开的MAMS数据集也可以用来做ABSA任务。

SemEval 14 Restaurant Review数据集中包含ATSA和ACSA两种版本,共有四千多条数据,分为训练集和测试集。ATSA的数据集也可以用来做Aspect Term Extraction,ACSA的数据集也可以用来做Aspect Category Extraction。

SemEval 14 Laptop Review数据集中只有ATSA版本,共有三千多条数据,也分为训练集和测试集。Laptop数据集相比Restaurant数据集有更多隐式表达情感的样本,数据量更少,难度更大。

Twitter数据集[2]中只有ATSA版本,共有六千多条数据,分为训练集和测试集。Twitter数据集相比Restaurant数据集和Laptop数据集质量较低。

MAMS数据集中包含ATSA和ACSA两种版本,共有一万多条数据。MAMS的特点是,一个句子中一定包含至少两个Aspect,并且同一个句子中至少有两个Aspect情感极性是不同的。而Restaurant,Laptop和Twitter这三个数据集中,大多数句子只包含一个Aspect或者包含多个相同情感的Aspect,这样会造成基于方面的情感分析任务退化成句子级别的情感分析任务。

基于方面的情感分析的变种

基于方面的情感分析除了4个子任务外还有两个变种。

一个是Targeted Aspect Based Sentiment Analysis,结合了ATSA和ACSA,旨在识别句子中针对一个指定实体(Target, Aspect term)的一个指定方面(Aspect category)的情感。数据集使用的是SentiHood数据集[3]。

另一个是抽取句子中和一个指定实体相关的情感词Target-oriented Opinion Words Extraction,使用的是TOWE数据集[4]。

参考文献

[1] Task Description: Aspect Based Sentiment Analysis (ABSA).

[2] Adaptive Recursive Neural Network for Target-dependent Twitter Sentiment Classification. ACL 2014.

[3] Sentihood: Targeted aspect based sentiment analysis dataset for urban neighbourhoods. COLING 2016.

[4] Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling. NACCL 2019.

### 回答1: Aspect-based sentiment analysis是一种文本分析技术,旨在识别文本中的不同方面(aspect)并对其情感进行分析。这种技术可以帮助企业了解消费者对其产品或服务的看法,从而改进其营销策略和产品设计。 ### 回答2: 方面情感分析是指一种自然语言处理技术,目的是从文本中提取文本中针对不同方面的情感,并分析和汇总这些情感。这种技术旨在帮助人们更好地理解用户对某个品牌、产品或服务的看法,并帮助企业更好地了解用户需求,提高用户满意度。 方面情感分析首先对文本进行标记化和词性标注等处理,然后从中提取涉及产品、服务或主题的关键词。分析这些关键词所涉及的方面,比如产品的性能、价格、设计等,然后将这些方面的情感值分析出来。 方面情感分析包括两个主要部分:方面分析和情感分析。方面分析着重于提取文本中的方面,包括主观方面(如感官体验、情感反应)和客观方面(如产品功能、价格等)。情感分析则通过对方面中的情感词进行分析,得出情感的极性和程度。 方面情感分析不仅可以帮助企业了解用户对其产品、服务或品牌的看法,还可以帮助企业识别用户需求和改进产品的缺陷,提高市场竞争力。与传统的情感分析相比,方面情感分析更加细致和准确,可以提供更精细的信息,有助于实现精细化营销。 ### 回答3: Aspect-Based Sentiment Analysis(ABSA)是指是一种基于自然语言处理的技术,旨在从观点或情感的角度分析文本中的不同方面。该技术在广告、品牌管理、社交媒体营销和舆情监测等方面具有广泛应用。 ABSA 的过程可以分为三个主要阶段: 首先,通过文本分析,将文本拆分成可独立分析的一系列方面,也被称为特征或属性。这些方面通常从主体产品或服务中提取,例如餐厅的食物、装修、服务、价格和位置等。 其次,对每个方面进行情感分析,以了解每个方面的观点或情感是否是积极、消极或中立的。当进行情感分析时,要考虑不同情感的标记和语义,以为每个方面赋予合适的情感极性。 最后,将每个方面的观点和情感结合起来,以得出文本整体的观点和情感。这可以通过对所有方面的评分进行汇总,基于特定产品或服务的整体观点或情感得出。 ABSA的成功关键在于结合自然语言处理技术和情感分析模型,以使计算机能够识别文本中的不同方面和情感。这项技术对于企业和组织来说非常有价值,因为它可以帮助他们更好地了解客户的需求、反馈和意见,进而提高产品和服务的质量和升级策略。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值