科研训练第十二周——关于代码的复现以及ASQP任务的论文阅读

Aspect Sentiment Quad Prediction as Paraphrase Generation——阅读笔记

一、Abstract

  • 提出了新的任务:ASQP四元组的抽取
  • 解决方案:转译生成( paraphrase generation process)

二、Motivation

  • ASQP任务第一次被提出(之前的工作都是aspect term 、opinion term、sentiment、category单独提取,或者两两、三三提取)小孩子才做选择,大人全都要 本文提出了四种因素一次性抽取

三、Introduction

思路:

  • 基于pipline的方法正确率会因为误差传播下降,所以本文提出了基于S2S的生成方法做这项工作

挑战:

  • 1)如何线性化需要的情感信息来适应S2S的学习
  • 2)如何使用预训练模型来辅助完成这项任务

方法:

  • 将四元组生成问题转化成句子到句子的释义问题

(food quality,pasta, over-cooked, negative)
-------------------->
“Food quality is bad because pasta is over-cooked”.

这样就可以用释义模型T5等(已经训练好的)无缝衔接这项任务😍

贡献:

  1. 研究了一个新的任务,即方面情绪四元预测(ASQP),并为每个样本引入了两个包含情绪四注释的数据集,旨在分析更全面的方面级情绪信息。
  2. 提出将ASQP作为一个释义生成问题,它可以一次性预测情绪四方,并充分利用自然语言标签的语义信息。
  3. 大量的实验表明,所提出的释义模型可以有效地处理ASQP和其他ABSA任务,在所有情况下都优于以前的最先进的模型。
  4. 实验还表明,释义方法在统一的框架下自然促进了相关任务之间的知识转移,这在低资源环境下尤其有利。

四、模型的方法阐述

在这里插入图片描述
步骤:

  • 1、首先进行数据的预处理:标注的(c,a,o,p)序列转化成句子,为了建模以及映射的方便,忽略句子的句法细节,转化方式如下
    在这里插入图片描述
    转化之后的句子如图所示:
    在这里插入图片描述

  • 基于S2S模型的encoder和decoder
    这部分的理论推导,需要自己学习一下
    利用T5模型,生成预测的句子

  • 检测生成的句子是否符合第一步的模式,若不符合则视作无效生成,舍弃;若符合,则进行拆解,得到四元组

Experimental Setup

1、实验材料

  • 数据集:Res15、 Res16(手动标注四元组)
  • 一些超参数的设置(略)
  • beams3\5\8------->类似贪婪解码这个还不是很了解,是尽可能生成多的可能结果?

2、对比试验
在这里插入图片描述

pipline的方法:下层模型抽取aspect-opinion,上层模型预测category-sentiment
unified的方法:GAS生成四元序列、TASO改变标签以达到同时生成aspect-opinion具体细节也是需要进一步探索

3、实验结果
如上图

  • pipline总体性能不是非常理想
  • GAS表现很好,体现了S2S性能由于pipline方法(减少了误差的传播),但是 ∣ V p ∣ ∗ ∣ V c ∣ |V_p|*|V_c| VpVc计算资源浪费较大
  • 而本文提出的模型,性能优越并且可以取得更好的准确性

关于一些碎碎念:

  • 可能慢慢就发现科研和自己最初想象的还是很不一样的~但是也没有很抵触,时间多的时候去做,发现自己还是蛮享受思考与讨论、debug与追索的过程的。不过大三确实比较忙(明明课程比大二少吖,但是就是时间都去哪里了灵魂拷问),连假期都被一堆事情占用,也可能是自己的时间管理还是欠火候叭。🙄
  • 到了现在,记录已经到了十二周了,时间过得好快吖,其实开题之后就已经不再那么追求所谓的结果了,为之后的学习先打下扎实的基础,结结实实地学会一些基本的技能(尤其是coding数学)、培养系统的思维我觉得可能对我而言会更加实际。😆菜鸡危险发言
  • 慢慢来慢慢来up!up!

关于服务器以及代码的故事

数据路径

/mnt/nfs-storage-1080/xxx

虚拟环境名称

/mnt/nfs-storage-1080/hyGao/absa_quad/ghy_base1

在这里插入图片描述
改完了一些版本不兼容的问题之后~(暴力的改法是注释掉所有缺失但是无关全局的import)
然后又是内存的问题
在这里插入图片描述
修改了batchsize=2之后可以运行~但是做好准备结果应该会受到影响

舒服了~
res15\16
在这里插入图片描述
在这里插入图片描述

加上配置环境和调参,最后出结果一共用了2h,因为内存的问题batchsize从16改成2,应该是这个原因导致性能的下降
果然下降了2-3个百分点😅, 情理之中,情理之中~

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值