在这里记录一下聊天机器人方面的了解。算是一个Survey吧。
聊天机器人有两种技术方向:
1. 基于检索
2. 基于生成模型
术语
Generation based automatic chatting system
Neural Response Generation(NRG)
Generative Adversarial Networks(GAN)
阅读列表
基于对抗学习的生成式对话模型的坚实第一步 ——始于直观思维的曲折探索
这篇文章介绍的是 “Neural Response Generation via GAN with an Approximate Embedding Layer”这篇论文的工作,现在还没发表,以后发表了找来看看。
第一次看到利用对抗网络来生成对话。
- Safe Response: 如何解决万金油一样的回答?
像这样的回答:“我也觉得”或“我也是这么认为的”
有时间试试在训练数据中将这样的回答去掉。
这里涉及到聊天机器人一个很重要的目标:diversity。
聊天数据中词语在句子不同位置的概率分布具有非常明显的长尾特性,这一特性通常在句子开头几个词语上体现得尤为明显,例如,相当大比例的聊天回复是以“我”“也”作为开头的句子。