Transformer系列 _7 机器翻译笔记2021-06-29

最新推荐文章于 2023-10-20 18:06:49 发布

qq_38038430

最新推荐文章于 2023-10-20 18:06:49 发布

阅读量151

点赞数

分类专栏：笔记文章标签： nlp 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38038430/article/details/118341393

版权

笔记专栏收录该内容

20 篇文章 0 订阅

订阅专栏

Neural Machine Translation

many to many
在这里插入图片描述
数据集预处理

两者都可以，实际机器翻译是Word-level，因为数据集足够大

为什么采用两个tokenizers?

两者语言的字符是不一样的，不同的语言也有不同的分词

training seqtoseq model

在这里插入图片描述
decoder的初始状态是encoder的最后一个状态，decoder靠state（h,c）来知道前面的输入的英语句子

第一个输入必须是起始符，根据输出的概率p与y计算crossentropy 进行反向传播，第二次decoder的输入

重复上述过程

搭建过程
在这里插入图片描述

inference

在这里插入图片描述

重复

summary

在这里插入图片描述
只输出最后一个状态

how to improve

在这里插入图片描述

encoder 可以是双向的LSTM，但是decoder（文本生成器）是单向的

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Transformer系列 _7 机器翻译笔记2021-06-29

Neural Machine Translationmany to many数据集预处理两者都可以，实际机器翻译是Word-level，因为数据集足够大为什么采用两个tokenizers?两者语言的字符是不一样的，不同的语言也有不同的分词training seqtoseq modeldecoder的初始状态是encoder的最后一个状态，decoder靠state（h,c）来知道前面的输入的英语句子第一个输入必须是起始符，根据输出的概率p与y计算crossentrop
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。