一、序列到序列学习(seq2seq)
使用两个循环神经网络来设计编码器和解码器,并将其应用于机器翻译的 序列到序列
(1)网络结构
编码器是一个RNN,读入输入的句子,可以是双向的,输出用作解码器的初始隐藏状态。
解码器是另一个RNN,训练时用目标句子输入,推理时用推理的结果
(2)评估
(3)总结
二、束搜索
其中 L是最终候选序列的长度
一、序列到序列学习(seq2seq)
使用两个循环神经网络来设计编码器和解码器,并将其应用于机器翻译的 序列到序列
(1)网络结构
编码器是一个RNN,读入输入的句子,可以是双向的,输出用作解码器的初始隐藏状态。
解码器是另一个RNN,训练时用目标句子输入,推理时用推理的结果
(2)评估
(3)总结
二、束搜索
其中 L是最终候选序列的长度