![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
对话系统
文章平均质量分 94
myofficials
nlper
展开
-
Seq2Seq系列(二):Sequence to Sequence
论文链接Sequence to Sequence Learning with Neural Networks 这是介绍Seq2Seq系列的第二篇文章,主要介绍Seq2Seq的基本模型。与第一篇论文Encoder-Decoder之间具有很强的连续性,内容较少。在这篇论文中,作者将Seq2Seq模型用于英译法的翻译任务中。 模型 Seq2Seq的基础是Encoder和Decoder模型,同样地原创 2018-01-14 16:20:15 · 953 阅读 · 0 评论 -
Seq2Seq系列(一):RNN Encoder-Decoder
系列介绍最近看了一些Seq2Seq模型的文章。东西看杂了容易忘记,花点时间简单的整理一下。 这个Seq2Seq系列主要梳理关于Seq2Seq模型的几篇重要的文章的模型,分为三个内容分别是:Encoder-Decoder, Sequence to Sequence 和 attention mechanism. 三个系列的文章列举如下:Seq2seq系列(一):RNN Encoder-D原创 2018-01-12 15:50:12 · 3239 阅读 · 1 评论 -
Seq2Seq系列(三):attention mechanism
论文链接:Neural Machine Translation by Jointly Learning to Align and Translate 这是介绍Seq2Seq系列的第三篇文章,主要讲带有attention机制的Seq2Seq模型。 首先,作者回顾了一下RNN Encoder-Decoder模型: ht=f(xt,ht−1)h_{t}=f(x_{t},h_{t-1}) c=q(原创 2018-01-15 14:50:30 · 1313 阅读 · 0 评论 -
DRL for Dialogue Generation论文学习零散记录
Deep Reinforcement Learning for Dialogue Generation 这是一篇将策略梯度(policy gradient)引入Seq2Seq来进行多轮对话的文章。使用策略梯度从三方面来reward: informativity,coherence, and ease of answering。作者提到将SEQ2SEQ模型用于dialogue genera...原创 2018-03-11 12:18:09 · 396 阅读 · 0 评论 -
A Diversity-Promoting Objective Function for Neural Conversation Models 论文阅读零散笔记
A Diversity-Promoting Objective Function for Neural Conversation ModelsSEQ2SEQ模型用于conversational responses倾向于产生safe, commonplace的response,比如(“I don’t know”)。这篇论文中作者提出了MMI(Maximum Mutual Information...原创 2018-03-11 13:33:30 · 930 阅读 · 0 评论 -
A Persona-Based Neural Conversation Model论文学习零散记录
A Persona-Based Neural Conversation Model这篇文章用来解决conversation model中的speaker consistency的问题。比方说,问chatbot“where does jone live?”& “where does sam live?”chatbot可能因为u.s.出现频率最高,而对所有这类问题的回答都是U.S. 而不去考虑人物的身份原创 2018-03-11 19:54:19 · 1288 阅读 · 0 评论