科研训练第十二周——关于代码的复现以及ASQP任务的论文阅读

Aspect Sentiment Quad Prediction as Paraphrase Generation——阅读笔记

一、Abstract

  • 提出了新的任务:ASQP四元组的抽取
  • 解决方案:转译生成( paraphrase generation process)

二、Motivation

  • ASQP任务第一次被提出(之前的工作都是aspect term 、opinion term、sentiment、category单独提取,或者两两、三三提取)小孩子才做选择,大人全都要 本文提出了四种因素一次性抽取

三、Introduction

思路:

  • 基于pipline的方法正确率会因为误差传播下降,所以本文提出了基于S2S的生成方法做这项工作

挑战:

  • 1)如何线性化需要的情感信息来适应S2S的学习
  • 2)如何使用预训练模型来辅助完成这项任务

方法:

  • 将四元组生成问题转化成句子到句子的释义问题

(food quality,pasta, over-cooked, negative)
-------------------->
“Food quality is bad because pasta is over-cooked”.

这样就可以用释义模型T5等(已经训练好的)无缝衔接这项任务😍

贡献:

  1. 研究了一个新的任务,即方面情绪四元预测(ASQP),并为每个样本引入了两个包含情绪四注释的数据集,旨在分析更全面的方面级情绪信息。
  2. 提出将ASQP作为一个释义生成问题,它可以一次性预测情绪四方,并充分利用自然语言标签的语义信息。
  3. 大量的实验表明,所提出的释义模型可以有效地处理ASQP和其他ABSA任务,在所有情况下都优于以前的最先进的模型。
  4. 实验还表明,释义方法在统一的框架下自然促进了相关任务之间的知识转移,这在低资源环境下尤其有利。

四、模型的方法阐述

在这里插入图片描述
步骤:

  • 1、首先进行数据的预处理:标注的(c,a,o,p)序列转化成句子,为了建模以及映射的方便,忽略句子的句法细节,转化方式如下
    在这里插入图片描述
    转化之后的句子如图所示:
    在这里插入图片描述

  • 基于S2S模型的encoder和decoder
    这部分的理论推导,需要自己学习一下
    利用T5模型,生成预测的句子

  • 检测生成的句子是否符合第一步的模式,若不符合则视作无效生成,舍弃;若符合,则进行拆解,得到四元组

Experimental Setup

1、实验材料

  • 数据集:Res15、 Res16(手动标注四元组)
  • 一些超参数的设置(略)
  • beams3\5\8------->类似贪婪解码这个还不是很了解,是尽可能生成多的可能结果?

2、对比试验
在这里插入图片描述

pipline的方法:下层模型抽取aspect-opinion,上层模型预测category-sentiment
unified的方法:GAS生成四元序列、TASO改变标签以达到同时生成aspect-opinion具体细节也是需要进一步探索

3、实验结果
如上图

  • pipline总体性能不是非常理想
  • GAS表现很好,体现了S2S性能由于pipline方法(减少了误差的传播),但是 ∣ V p ∣ ∗ ∣ V c ∣ |V_p|*|V_c| VpVc计算资源浪费较大
  • 而本文提出的模型,性能优越并且可以取得更好的准确性

关于一些碎碎念:

  • 可能慢慢就发现科研和自己最初想象的还是很不一样的~但是也没有很抵触,时间多的时候去做,发现自己还是蛮享受思考与讨论、debug与追索的过程的。不过大三确实比较忙(明明课程比大二少吖,但是就是时间都去哪里了灵魂拷问),连假期都被一堆事情占用,也可能是自己的时间管理还是欠火候叭。🙄
  • 到了现在,记录已经到了十二周了,时间过得好快吖,其实开题之后就已经不再那么追求所谓的结果了,为之后的学习先打下扎实的基础,结结实实地学会一些基本的技能(尤其是coding数学)、培养系统的思维我觉得可能对我而言会更加实际。😆菜鸡危险发言
  • 慢慢来慢慢来up!up!

关于服务器以及代码的故事

数据路径

/mnt/nfs-storage-1080/xxx

虚拟环境名称

/mnt/nfs-storage-1080/hyGao/absa_quad/ghy_base1

在这里插入图片描述
改完了一些版本不兼容的问题之后~(暴力的改法是注释掉所有缺失但是无关全局的import)
然后又是内存的问题
在这里插入图片描述
修改了batchsize=2之后可以运行~但是做好准备结果应该会受到影响

舒服了~
res15\16
在这里插入图片描述
在这里插入图片描述

加上配置环境和调参,最后出结果一共用了2h,因为内存的问题batchsize从16改成2,应该是这个原因导致性能的下降
果然下降了2-3个百分点😅, 情理之中,情理之中~

### 回答1: Aspect-based sentiment analysis是一种文本分析技术,旨在识别文本中的不同方面(aspect)并对其情感进行分析。这种技术可以帮助企业了解消费者对其产品或服务的看法,从而改进其营销策略和产品设计。 ### 回答2: 方面情感分析是指一种自然语言处理技术,目的是从文本中提取文本中针对不同方面的情感,并分析和汇总这些情感。这种技术旨在帮助人们更好地理解用户对某个品牌、产品或服务的看法,并帮助企业更好地了解用户需求,提高用户满意度。 方面情感分析首先对文本进行标记化和词性标注等处理,然后从中提取涉及产品、服务或主题的关键词。分析这些关键词所涉及的方面,比如产品的性能、价格、设计等,然后将这些方面的情感值分析出来。 方面情感分析包括两个主要部分:方面分析和情感分析。方面分析着重于提取文本中的方面,包括主观方面(如感官体验、情感反应)和客观方面(如产品功能、价格等)。情感分析则通过对方面中的情感词进行分析,得出情感的极性和程度。 方面情感分析不仅可以帮助企业了解用户对其产品、服务或品牌的看法,还可以帮助企业识别用户需求和改进产品的缺陷,提高市场竞争力。与传统的情感分析相比,方面情感分析更加细致和准确,可以提供更精细的信息,有助于实现精细化营销。 ### 回答3: Aspect-Based Sentiment Analysis(ABSA)是指是一种基于自然语言处理的技术,旨在从观点或情感的角度分析文本中的不同方面。该技术在广告、品牌管理、社交媒体营销和舆情监测等方面具有广泛应用。 ABSA 的过程可以分为三个主要阶段: 首先,通过文本分析,将文本拆分成可独立分析的一系列方面,也被称为特征或属性。这些方面通常从主体产品或服务中提取,例如餐厅的食物、装修、服务、价格和位置等。 其次,对每个方面进行情感分析,以了解每个方面的观点或情感是否是积极、消极或中立的。当进行情感分析时,要考虑不同情感的标记和语义,以为每个方面赋予合适的情感极性。 最后,将每个方面的观点和情感结合起来,以得出文本整体的观点和情感。这可以通过对所有方面的评分进行汇总,基于特定产品或服务的整体观点或情感得出。 ABSA的成功关键在于结合自然语言处理技术和情感分析模型,以使计算机能够识别文本中的不同方面和情感。这项技术对于企业和组织来说非常有价值,因为它可以帮助他们更好地了解客户的需求、反馈和意见,进而提高产品和服务的质量和升级策略。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值