《论文阅读》Towards Expressive Communication with Internet Memes: A New Multimodal Conversation Dataset and Benchmark
期刊:Computing Research Repository (CoRR)
时间:2021-09
类型:情感对话
特点:提出baseline模型&& DSTC10 开放域对话挑战数据集
本文带来Zhengcong Fei, Zekang Li, Jinchao Zhang, Yang Feng, Jie Zhou共同创作的文章
前言
这篇文章是之前我阅读的另一篇文章的”前传“,相当于是现有这篇文章作为铺垫,才有了那篇文章的更进,两者都提出了对三个子任务的探索过程,感兴趣地同学可以参考我的文章 《论文阅读》Towards Building an Open-Domain Dialogue System Incorporated with Internet Memes
简介
网络表情包作为一种新的表达元素,使对话生动、感人、有趣,在网络聊天场景中广受欢迎和广泛使用。然而,当前大多数对话研究都集中在纯文本对话任务上。在本文中,我们提出了一个名为 Meme 并入的开放域对话 (MOD) 的新任务。与之前的对话任务相比,MOD 更具挑战性,因为它需要模型理解多模态元素以及它们背后的情感。为了促进 MOD 研究,我们构建了一个大规模的开放域多模态对话数据集,将丰富的互联网meme整合到话语中。该数据集由 ∼45K 中文对话和 ∼606K 话语组成。每个对话包含大约 13 个话语,平均大约有 4 个 Internet meme,每个带有 Internet meme 的话语都