《论文阅读》MOJITALK: Generating Emotional Responses at Scale
期刊:ACL2018
类型:通过emoji为情感标签进行对话生成
特点:数据集无需人工标注情感
本文带来Xianda Zhou, William Yang Wang共同创作的文章
简介
生成情感语言是构建具有同理心的自然语言处理代理的关键一步。然而,这一研究方向的一个主要挑战是缺乏大规模的标记训练数据,而之前的研究仅限于少量的人类注释情感标签。此外,明确控制生成文本的情绪和情绪也很困难。在本文中,我们采取了一种更激进的方法:我们利用利用自然标记为表情符号的 Twitter 数据的想法。
我们收集了大量 Twitter 对话语料库,其中包括响应中的表情符号,并假设表情符号传达了句子的潜在情感。我们研究了几个对这些对话进行训练的条件变分自动编码器,这使我们能够使用表情符号来控制生成文本的情绪。通过实验,我们在定量和定性分析中表明,所提出的模型可以根据指定的情绪成功地生成高质量的抽象对话响应。
论文试图解决什么问题?
情感对话生成的关键在于有大量带有情感色彩的对话数据集,但是相关数据集中对于情感的分类极其有限,不足以捕捉人类对话之间微妙的情感变化。所以就需要找到一种对话数据集集两者优点于一体。
目前了解到的对对话进行情感嵌入的方法有:
- 常规操作:额外的情感标签[happy,sad],这一般是进行人工标注,或是训练一个情感分类器[如ECM、EmoDS、EmpTransfo]
- 后来就有人发现人工标注不现实,但是情感分类器这种很难识别出一些隐式的情感表达,如我现在像热锅上的蚂蚁[急躁,焦虑],模型会无法识别,