dialogue system
seeledu
这个作者很懒,什么都没留下…
展开
-
Reward Estimation for Dialogue Policy Optimisation 阅读
这是本周5月7日到5月13日约定看完的,每看完一部份,就写一段简要翻译和感想摘录吧。 希望能坚持下去。 Abstract 将对话管理看作是一个强化学习任务可以使得一个系统尝试最大化回报函数,从而优化行为。这个回报函数被设置为诱导系统动作满足目标应用和任务驱动应用,这一般意味着要尽可能地满足用户的目标。但是,在真实口语对话系统中,因为用户的目标一般只有他们自己知道,所以回报很难被衡量。当然,原创 2018-05-08 23:07:43 · 239 阅读 · 0 评论 -
End to end Memory Networks with Knowledge Carryover for Multi-Turn Sporken Language Understanding
摘要这是一篇讲述在利用端到端记忆网络做多轮次的口语语言理解的论文。里面提及利用多轮次的信息主要有两个挑战:1、上X轮的错误有可能会传送到后面的轮次。2、上X论的信息可能会忘记。本文采用对对话和对应的意图以及槽信息都编码为记忆,然后用注意力机制进行解码,利用储存的语义同时应用在意图分类和槽信息填充的任务中。在微软小娜的数据集上比单轮的rnn有更加的效果。小评用编码的方式实现对多轮次的对话信息的保存是...原创 2018-06-02 15:17:37 · 505 阅读 · 1 评论