Seq2Seq,全称为Sequence to Sequence模型(序列到序列模型,目前还没有很好的翻译),意思可以解释为将一个序列信号(长句子、段落、图像提取的特征、音频信号等),通过编码和解码生成一个新的序列信号(摘要短句、文本描述、识别文本),通常用于机器翻译、图片描述、自动对话、语音识别等领域
(一)、什么是Seq2Seq模型?
seq2Seq模型的核心思想,通过深度神经网络将一个作为输入的序列信号转换为输出的序列信号,这一过程由编码和解码两个过程构成。在经典的实现中,编码器和解码器各由一个循环神经网络(RNN,LSTM,GRU均可)构成,在Seq2Seq中,两个循环神经网络是共同训练的
如下图,描述了几种Seq2Seq模型:
one to one:一个输入预测一个输出(如:一张图片预测图片分类)
one to one 网络结构图如下:
one to many:一个输入预测一个序列输出(如:图画描述,输入一张图片预测这张图片的一个序列的文字描述)
one to many网络结构如下:
第(1)种形式,我们只将