论文阅读及代码学习-Directed Acyclic Graph Network for Conversational Emotion Recognition

最新推荐文章于 2024-03-17 16:43:27 发布

南京烤鸭

最新推荐文章于 2024-03-17 16:43:27 发布

阅读量966

点赞数 1

分类专栏：论文阅读文章标签： python gru pytorch nlp

本文链接：https://blog.csdn.net/m0_59892618/article/details/121128861

版权

本文提出了一种新的对话情感识别方法——DAG-ERC，它结合了图神经网络和递归神经网络，通过有向无环图结构有效地捕获长距离对话信息。在IEMOCAP、MELD、DailyDialog等数据集上，模型表现出色，解决了传统模型的信息丢失问题。

摘要由CSDN通过智能技术生成

主要针对模型和数据集方面进行了介绍，略过了实验结果部分。

一、前言

文章通过将传统的基于图形的神经网络模型与基于递归的神经模型进行结合，提出了一种通过有向无环图将对话进行编码的新思路，这种新型的编码方式能够更好地结合long-term对话信息以及相邻上下文的信息，并在四个baseline上取得了很好的效果。

基于图的神经网络模型只会从一个固定长度的window内获取对话信息，这种模型的缺点就是会损失掉一些稍远距离的对话和序列信息；基于递归的神经模型通过用编码的方式来获取一定时间步内的对话和序列信息，然而，这种模型往往只使用最近的语句中相对有限的信息来更新语句的状态，这使得它们很难获得令人满意的性能。

使用有向无环图结构的好处是建模过程可以根据真实对话发生的顺序来进行，即一个句子的节点只能获取到过去发生的对话信息而无法获取到还未发生的对话信息，同时也无法包含指向自己的一条边。

二、数据集介绍

文章的实验部分主要使用了四个数据集，IEMOCAP、MELD、DailyDialog以及DailyDialog，文章只使用了多模态数据集中的文字数据来进行实验，这几个数据集都经过了预训练语言模型roberta进行特征提取，以IEMOCAP做例子，在pycharm的debug中看一下其中数据是如何表示的：