从头实现一个深度学习的对话系统--1,论文简介

最新推荐文章于 2024-07-18 16:15:38 发布

liuchongee

最新推荐文章于 2024-07-18 16:15:38 发布

阅读量5k

点赞数

分类专栏：深度学习 nlp QA TensorFlow QA_对话机器人_机器阅读专题深度学习与NLP--论文笔记和TensorFlow实现文章标签：对话系统 Seq-to-Seq 深度学习

本文链接：https://blog.csdn.net/liuchonge/article/details/78809555

版权

本文回顾了几篇关于Seq-to-Seq模型的重要论文，这些论文最初应用于机器翻译，随后被广泛应用于对话系统。Seq-to-Seq模型通过RNN Encoder-Decoder结构解决了序列数据的处理问题，通过Attention机制改善了长序列的处理效果，为对话系统奠定了基础。

摘要由CSDN通过智能技术生成

上篇文章我们介绍了DRL用于对话系统的应用，看完论文我们会发现，其是在一个Seq-to-Seq模型的基础上进行重新训练进而得到效果的提升，那么自然我们会想到如何使用Seq-to-Seq模型构造基础的对话系统呢，接下来我会使用几篇文章来一步步介绍使用Seq-to-Seq构造对话系统过程中所用到的知识和代码。首先让我们从提出Seq-to-Seq模型的论文说起：

本文主要介绍下面几篇Seq-to-Seq刚被提出时的几篇文章：

Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation
Sequence to Sequence Learning with Neural Networks
Neural Machine Translation by Jointly Learning to Align and Translate
Grammar as a Foreign Language
On Using Very Large Target Vocabulary for Neural Machine Translation
A Neural Conversational Model

这里不会详细的去介绍每一篇论文，而是从作者、时间线、模型结构、应用领域等几个方面介绍一下，因为我在看别人博客、论文的过程中发现这几篇论文总是会被提及，所以就简单做一个总结，至于Seq-to-Seq模型的细节我会放在下一篇文章中进行详细介绍。