神经机器翻译
构造一个大型网络,以一种端到端的方式对这个网络进行训练和优化
端到端指的是(编码器-解码器结构)还是源语言-目标语言?
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190623200626504.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1hpYW9feWFubGluZw==,size_16,color_FFFFFF,t_70)
Encoder:将输入序列压缩成一个语义向量c
Decoder:根据语义向量c生成一个指定的序列
两种模式:
(1)将语义向量c作为decoder的初始状态
(2)将语义向量c当做decoder每一步的输入
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190623201539353.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1hpYW9feWFubGluZw==,size_16,color_FFFFFF,t_70)
神经机器翻译 的优势:
(1)用端到端的形式进行训练,可以从一个单一的损失函数同时训练模型的所有参数
(2)分布式表示,允许在相似的词和短语之间建立统计关系,并借此获得更好的预