论文:Sequence to Sequence Learning with Neural Networks
作者:Ilya Sutskever,Oriol Vinyals,Quoc V. Le
需补习知识:RNN,LSTM,SGD,PCA,beam search
what:
提出一个端到端的序列学习的编解码模式
应用于英文->法语的翻译任务
why:
DNN虽然灵活,但局限性在于输入和输出只允许固定维度向量,且维度是已知的
how:
seq2seq模型由两部分组成:
encoder:
- 一个 deep LSTM
- 将长度可变的input sequence映射为定长vector
deoder:
- 另一个 deep LSTM
- 将上一步的定长vector解码到target sequence