本文是微软研究软邓力老师的文章,构建了一种从知识图谱中形成response的聊天机器人KB-InfoBot,并且提出了一种端到端的增强学习训练方案。
(本文对于构建一个端到端的KB + task-oriented chatbot非常有启发和指导意义)
introduction
一个典型的goal-oriented(就是比如query一个人演的某年电影)一般由四个部分组成:
一,language understanding(LU)模块来预测用户目的以及抽取相关slots;
二,一个对话状态记录器来记录用户意图和对话历史;
三,一个对话规则来根据当前的状态选择下一步的系统行动;
四,natural language generator (NLG)来把对话行动转化为自然语言
有必要给对话规则以数据库里的真实世界的知识,之前的end-to-end系统通过构造一个symbolic query以及从数据库里取数据来实现这点,不幸的是,这样的操作让模型non-differentiable以及对话系统的各个模块分开被训练。
在我们的工作,我们将类SQL的查询替换为一个probabilistic framework for inducing a 后验分布 of the user target over KB entities,
我们从the belief tracker multinomials over attribute-values and binomial probabilities of the user not knowing the
value of an attribute来构造这个分布。