Sequence-to-Sequence Model (Seq2Seq)

Sequence-to-Sequence Model (Seq2Seq)

用Seq2Seq实现机器翻译:多对多问题在这里插入图片描述
机器翻译数据Machine Translation Data
http://www.manythings.org/anki/
在这里插入图片描述

数据处理:大小写,拼写错误等(数据预处理)->tokenization(它可以是char-level也可以是word-level的 )->建立两个字典(一个英语一个德语的,因为每种语言使用的字母个数或者词语构造不一样)
在这里插入图片描述
英语->德语:
在这里插入图片描述

Seq2Seq Model

一个编码器encoder,一个解码器decoder
encoder的最终输出是最后的状态h和传输带c
decoder的初始状态是encoder的最终输出
预测p,p作为标签
计算损失函数loss,反向传播更新模型参数
如下图,当前的标签是‘m’
在这里插入图片描述
不断重复上述过程,直到输出终止符
在这里插入图片描述

每一轮的状态h,c都会更新
decoder的输出是每个字符的概率值
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>