《实验细节》MELD文本预处理

最新推荐文章于 2023-08-23 18:59:07 发布

365JHWZGo

最新推荐文章于 2023-08-23 18:59:07 发布

阅读量1.5k

点赞数 1

分类专栏： NLP 文章标签： python 人工智能

本文链接：https://blog.csdn.net/qq_44833392/article/details/128678251

版权

NLP 专栏收录该内容

89 篇文章 51 订阅 ¥29.90 ¥99.00

订阅专栏

MELD数据集源自EmotionLines，包含1443段对话，每段对话平均9.5句话，标注了7种情绪。本文档介绍了数据集的大小、文件结构，以及如何将数据预处理并保存为pickle和json格式。

摘要由CSDN通过智能技术生成

题记

MELD数据集源于EmotionLines[10]数据集，后者是一个纯文本的对话数据集，来自于经典电视剧老友记。MELD数据集包含了与EmotionLines相同的对话，并在此基础上包含了视频、音频和文本的多模态数据。数据集总共包含1443段对话，13708句话语，平均每段对话有9.5句话，每句话平均持续时间为3.6秒。对话片段的每句话被标注为七种情绪标签的其中一个，包括生气、厌恶、悲伤、快乐、中性、惊喜和恐惧。与此同时，每句话也拥有相应的情感标签，分为积极、消极和中性。

数据集详情

大小

12GB

文件结构

在这里插入图片描述

文本数据格式

标题	内容	含义
Sr No.	2
Utterance	You must’ve had your hands full.	文本

了解本专栏

365JHWZGo

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
《实验细节》MELD文本预处理

MELD数据集源于EmotionLines[10]数据集，后者是一个纯文本的对话数据集，来自于经典电视剧老友记。MELD数据集包含了与EmotionLines相同的对话，并在此基础上包含了视频、音频和文本的多模态数据。数据集总共包含1443段对话，13708句话语，平均每段对话有9.5句话，每句话平均持续时间为3.6秒。对话片段的每句话被标注为七种情绪标签的其中一个，包括生气、厌恶、悲伤、快乐、中性、惊喜和恐惧。与此同时，每句话也拥有相应的情感标签，分为积极、消极和中性。我们希望将数据保存为如下格式。
复制链接

扫一扫