新的一年,想发有关对话系统的paper?快关注时下最大热点:智能化与个性化...

640


TL;DR: 为大家介绍和分析一个即将成为未来一年研究热点的 sub-topic: Personalized Dialog System!有强烈发 paper 的小伙伴们注意啦,上面这句话对你们来说翻译过来就是:这就是 19 年最有可能 get paper accepted 的任务之一咯!


作者丨骆梁宸

学校丨北京大学本科在读

研究方向丨Dialogue/NLP/ML Theory

个人主页https://www.luolc.com/


NLP的四个Open Problems & 对话系统的重要性


相信很多 NLP 研究者都已经拜读过由 Sebastian Ruder 在 Deep Learning Indaba 2018 上的 talk 整理而来的文章:The 4 Biggest Open Problems in NLP


http://ruder.io/4-biggest-open-problems-in-nlp/


这篇含金量十足的文章来自于对包括 Yoshua Bengio 在内的 20 余位领域内顶级研究者的访谈整理而来。


四个 open problems 中排名第一的是 Natural Language Understanding(自然语言理解)问题,解决它是许多 NLP tasks 能否顺利实现的先决条件。与此同时,非常多的研究人员同时提到 Dialogue System(对话系统),特别是 Goal-Oriented(任务型)Dialogue System 也是一个非常重要的 open problem,或者说,是检验 NLU 问题是否可解的一种终极方式。 


从大约 2016、2017 年起,针对 Dialogue System 的研究逐渐从鲜有人问津到逐渐引起 NLP 社区内的重视。在刚刚过去的一年里,相关工作的数量增长迅猛,显示出其成为 NLP 领域内新一 (hǎo) 热 (guàn) 点 (shuǐ) 方向的潜质。 


而另一方面,随着发展初期通过将 Neural Machine Translation 中的方法直接换汤不换药的迁移到 Dialogue 的快速灌水阶段逐渐结束,如今再想要在这一 track 下发表文章已经不能再像从前那样简单粗暴,而必须要想办法聚焦到 Dialogue 中更加核心、更加有价值的点。 


在上文提到的访谈中 Kevin Gimpel 提到:


We should develop systems that read and understand text the way a person does, by forming a representation of the world of the text, with the agents, objects, settings, and the relationships, goals, desires, and beliefs of the agents, and everything else that humans create to understand a piece of text. Until we can do that, all of our progress is in improving our systems’ ability to do pattern matching.


从这段话其实也能推断出 Dialogue 任务为什么被认为“非常困难”。以 NMT 作为对比,我们可以发现在大部分情形下,除非涉及很高的文学技巧或极深的历史背景,通常而言 NMT 只需要聚焦在所翻译的文本本身即可,几乎没有任何外沿 —— 一个好的翻译系统,其实就是要稳定准确且还原本意即可。


而对话则大有不同,想象人类对话的场景,决定我们如何产生或回复一句话的因素来自方方面面:对话的场合、谈话的目的、双 (多) 方的身份和心理与情绪状态等。这些通通隐藏在一句句对白的背后,是同样需要 forming 的 representation. 我们需要设法构造更加智能化的系统以关注到这些问题。 


其中最为重要,也即将成为未来一段时间热点之一的,是 Dialogue System 的个性化问题。


Personalization in Dialogue System


对话的一个显著特点,同时也是与其他 NLP 场景如翻译、摘要和阅读理解等最大的不同,是谈话者具有的身份特征。很容易理解,一句话的风格随着其说出者的不同可以有极大变化;此外,在人们日常交流中,根据对方的身份和偏好灵活调整谈话的内容、风格和策略是非常自然的行为——而这些在 conventional dialogue model 中完全无法得以体现。 


在以 Jiwei Li 的工作 [1] 为代表的早期研究中,研究者们对个性化问题的前一部分,即为 chatbot 赋予特定人格进行了一定探索。但这一类工作的实用性是有明显限制的——我们更加期望 Agent 能够根据我们每个人的自身特点对我们进行个性化服务,而并不在意面对的 Agent 是性格温和、暴躁、还是傲娇的——实际上这类模型最具前景的实用化方向大概就是游戏 NPC 构建了。 


而个性化中意义更大的另一方面,即设法让 Agent 可以感知用户身份和偏好并以此提供个性化的对话,难度要大很多。这主要是受限于数据集的缺失——我们长期缺少额外标注有对话者的信息的数据集。


而上段提到的赋予人格,其实非常类似于 language style transfer/assignment 任务,并不过多受限于 Dialogue 的形式,因而可以通过其他类型的带身份标注的语料进行补充。而针对对方身份进行个性化,则是无论如何无法绕过带身份信息的 dialogue dataset 的。 


而我们之所以能推测个性化对话系统很快将成为研究热点,便是因为数据集这一关键问题已经被解决了。 


做 Dialogue System 的同学一定都知道 FAIR 的一个组:Team PerlAI。其不仅产出了 NLP 领域近十年来最重要的成果之一 Memory Network,更重要的是在近年持续的发布新鲜高质量的对话数据集。


在 2018 年初他们新 release 了名为 Persona-Chat 的数据集 [2],其中每段对话都包含了对谈话双方的 natural text 形式的描述。在 NeurIPS 2018 上还进一步扩充并完善了数据集作为 shared competition task。


更近的时候,ParlAI 还发布了和 CV 结合的 personalized image chat 数据集 [3]。此外,除了以上基于 chitchat 的数据集,ParlAI 也收录 personalized bAbI dialog 这一个性化 goal-oriented 数据集 [4]


Learning Personalized End-to-End Goal-Oriented Dialog


值得一提的是,以上这些个性化对话的研究都是基于 chitchat 的。而任务型对话,例如餐馆预定服务、个人助理等,也同样非常需要针对用户进行个性化服务。这一方向的研究数量还较少,但具有很高的实用价值和继续探索的空间,是非常适合继续深入(& 发 paper)的蓝海。 


在本文的最后,简略介绍一篇即将于本周四(2019.1.31)在 AAAI-19 上 presenting 的文章,有关任务型对话的个性化:


640?wx_fmt=jpeg


https://www.luolc.com/publications/personalized-goal-oriented-dialog/


上方链接的文章 website 中还较为详细的概况了最近一段时间有关 Personalization 的其他相关进展,比本文所述更为详尽,可以先阅读了解。


640?wx_fmt=png

 Figure 1(a): Three example dialogs are chosen from the personalized bAbI dialog dataset. Personalized and content-based responses are generated by the Personalized MemN2N and a standard memory network, respectively.


640?wx_fmt=png

 Figure 1(b): Examples of valid candidates from a knowledge base that match the user request.


我们从一个例子出发,直观感受一下 conventional model 在不考虑个性化的情况下有什么不足。 


图中的对话发生在餐馆预定的场景中。Dialogue agent 需要根据用户的请求推荐餐馆,并在必要的时候提供额外信息。在三组对话中,用户输入的请求都是完全相同的。前两组对话的用户是一位年轻男性,非素食偏好;第三组对话的用户是一位年长女性,素食偏好。Figure 1(b) 是 KB 中检索到的满足用户要求的两个餐馆。 


可以观察到: 


1. 传统模型的回复是朴素和无趣的,且无法像个性化模型一样根据用户身份调整语气和称呼;


2. 在推荐餐馆阶段,传统模型只能按随机顺序给出推荐 (即无法判断两个可能的选择中哪个更可能受顾客青睐),而个性化模型则可以动态的调整推荐策略,在上例中,即是正确的考虑到了用户是否有素食偏好;


3. 最后,注意到用户请求中的「contact」既可以被解读成 KB 中的「phone」也可以被解读为「social media」。个性化模型在训练中可以学习到年轻人倾向社交媒体账号而年长者倾向电话号码这一事实,从而解决歧义而给出用户更期望的信息。


这些现象反映了目前模型中对应的三个问题: 


  • 无法灵活调整语言风格 [5] 

  • 缺少根据用户信息动态调整对话策略的能力 [4] 

  • 难以处理用户请求中的歧义项 


而个性化任务型对话系统的目标便是解决上述问题。需要注意的是,在任务型对话中的个性化与 chitchat 有显著不同。区别于给 Agent 赋予一个 consistent 的个性,任务型对话中的个性化要更多的聚焦在用户的个性并需要 Agent 拥有对不同对话者进行调整从而提升对话效率和用户满意度的能力。


640?wx_fmt=png

 Figure 2: Personalized MemN2N architecture.


文章提出的模型 Personalized MemN2N 基于适用任务型对话的经典模型 End-to-End Memory Network,包含三个主要部分:profile embedding、global memory、personalized preference。


用户输入会被 encode 为一个 query vector,模型会读取 memory(左上部分)寻找相关的对话历史并生成 attention weights,之后加权求和并做线性变换得到输出 vector,这一部分即是原始的 MemN2N


Profile Embedding


以 K-V 对表示的用户信息在 One-Hot 编码后经过一个可学习的参数矩阵变换为 profile embedding,在每一次 memory network 的迭代中加入到 query vector 中,并且用于修正 candidate pool 中的回复(根据用户身份直接过滤掉语气不得体的一部分 candidates)。


Global Memory


这一部分(左下)和 MemN2N 的结构相同,区别在于 memory 中储存的并非当前对话历史,而是其他类似的用户发生的其他对话的内容。这是基于类似的用户可能具有对答案类似的倾向而设计的。


Personalized Preference


这一部分用于处理用户请求的歧义部分,模型可以对 KB 中的每一列学习到一个 preference term,然后基于此对 logits 进行修正,以推荐用户更偏好的信息。


640?wx_fmt=png


在任务型对话个性化数据集 personalized bAbI dialog 上,文章提出的模型在完整数据集上刷新了原先 state-of-the-art 模型超过 7 个百分点。 


除此之外,文章进行了许多定量和定性分析,包括中间参量的可视化,可解释性讨论和对照实验等。同时,在人工评测中,新模型也在任务完成率和用户满意度两项指标上获得显著提升。在此不做详细阐述,具体细节可以浏览文章的 Analysis 章节。


总结


对话系统中的个性化无疑将成为新的一年里最值得探索的方向之一,尤其是对于希望尽快发 paper 的同学,是非常不错的一个新坑。而 Persona-Chat 和 Personalized MemN2N 则分别代表了 chitchat 和 goal-oriented 两类 dialogue 任务中的最新 state-of-the-art,后者更是填补了任务型对话中的空白。如果希望做一些这方面新的工作,这两篇文章是很重要的参考。


提前祝各位新春快乐!新的一年多发 paper 哟~ ^.^


参考文献


[1] Jiwei Li, Michel Galley, Chris Brockett, Georgios P. Spithourakis, Jianfeng Gao, Bill Dolan. A Persona-Based Neural Conversation Model. ACL 2016. 

[2] Saizheng Zhang, Emily Dinan, Jack Urbanek, Arthur Szlam, Douwe Kiela, Jason Weston. Personalizing Dialogue Agents: I have a dog, do you have pets too?. ACL 2018. 

[3] Kurt Shuster, Samuel Humeau, Antoine Bordes, Jason Weston. Engaging Image Chat: Modeling Personality in Grounded Dialogue. arXiv:1811.00945, 2018. 

[4] Chaitanya K. Joshi, Fei Mi, Boi Faltings. Personalization in Goal-Oriented Dialog. NIPS 2017. 

[5] Jonathan Herzig, Michal Shmueli-Scheuer, Tommy Sandbank and David Konopnicki. Neural Response Generation for Customer Service based on Personality Traits. INLG 2017. 


640?



点击以下标题查看更多往期内容: 





640?#投 稿 通 道#

 让你的论文被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢? 答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。


来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向) 

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接 

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志


? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site 

• 所有文章配图,请单独在附件中发送 

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通




?


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧



关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。


640?

▽ 点击 | 阅读原文 | 获取最新论文推荐

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值