科研训练第十二周——关于代码的复现以及ASQP任务的论文阅读

最新推荐文章于 2024-01-04 14:36:02 发布

理想国の糕

最新推荐文章于 2024-01-04 14:36:02 发布

阅读量1.2k

点赞数 3

分类专栏：科研训练文章标签：深度学习自然语言处理机器学习

本文链接：https://blog.csdn.net/qq_45751990/article/details/121627847

版权

科研训练专栏收录该内容

14 篇文章 4 订阅

订阅专栏

Aspect Sentiment Quad Prediction as Paraphrase Generation——阅读笔记

一、Abstract

提出了新的任务：ASQP四元组的抽取
解决方案：转译生成（ paraphrase generation process）

二、Motivation

ASQP任务第一次被提出（之前的工作都是aspect term 、opinion term、sentiment、category单独提取，或者两两、三三提取）~~小孩子才做选择，大人全都要~~ 本文提出了四种因素一次性抽取

三、Introduction

思路：

基于pipline的方法正确率会因为误差传播下降，所以本文提出了基于S2S的生成方法做这项工作

挑战：

1）如何线性化需要的情感信息来适应S2S的学习
2）如何使用预训练模型来辅助完成这项任务

方法：

将四元组生成问题转化成句子到句子的释义问题

(food quality,pasta, over-cooked, negative)
-------------------->
“Food quality is bad because pasta is over-cooked”.

这样就可以用释义模型T5等（已经训练好的）无缝衔接这项任务😍

贡献：

研究了一个新的任务，即方面情绪四元预测(ASQP)，并为每个样本引入了两个包含情绪四注释的数据集，旨在分析更全面的方面级情绪信息。
提出将ASQP作为一个释义生成问题，它可以一次性预测情绪四方，并充分利用自然语言标签的语义信息。
大量的实验表明，所提出的释义模型可以有效地处理ASQP和其他ABSA任务，在所有情况下都优于以前的最先进的模型。
实验还表明，释义方法在统一的框架下自然促进了相关任务之间的知识转移，这在低资源环境下尤其有利。

四、模型的方法阐述

在这里插入图片描述
步骤：

1、首先进行数据的预处理：标注的（c,a,o,p）序列转化成句子，为了建模以及映射的方便，忽略句子的句法细节，转化方式如下

转化之后的句子如图所示：
基于S2S模型的encoder和decoder
这部分的理论推导，需要自己学习一下
利用T5模型，生成预测的句子
检测生成的句子是否符合第一步的模式，若不符合则视作无效生成，舍弃；若符合，则进行拆解，得到四元组

Experimental Setup

1、实验材料

数据集：Res15、 Res16(手动标注四元组)
一些超参数的设置（略）
beams3\5\8------->类似贪婪解码这个还不是很了解，是尽可能生成多的可能结果？

2、对比试验
在这里插入图片描述

pipline的方法：下层模型抽取aspect-opinion,上层模型预测category-sentiment
unified的方法：GAS生成四元序列、TASO改变标签以达到同时生成aspect-opinion具体细节也是需要进一步探索

3、实验结果
如上图

pipline总体性能不是非常理想
GAS表现很好，体现了S2S性能由于pipline方法（减少了误差的传播），但是 $V_p|*|V_c|$ 计算资源浪费较大
而本文提出的模型，性能优越并且可以取得更好的准确性

关于一些碎碎念：

可能慢慢就发现科研和自己最初想象的还是很不一样的~但是也没有很抵触，时间多的时候去做，发现自己还是蛮享受思考与讨论、debug与追索的过程的。不过大三确实比较忙（明明课程比大二少吖，但是就是时间都去哪里了灵魂拷问），连假期都被一堆事情占用，也可能是自己的时间管理还是欠火候叭。🙄
到了现在，记录已经到了十二周了，时间过得好快吖，其实开题之后就已经不再那么追求所谓的结果了，为之后的学习先打下扎实的基础，结结实实地学会一些基本的技能（尤其是coding和数学）、培养系统的思维我觉得可能对我而言会更加实际。😆~~菜鸡危险发言~~
慢慢来慢慢来_up!up!