Transformer具体如何进行机器翻译

思考实践

已于 2022-05-24 10:04:35 修改

阅读量1.9k

点赞数 1

分类专栏：人工智能、机器学习、深度学习文章标签： transformer 机器翻译深度学习

于 2022-05-23 15:56:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43332715/article/details/124926294

版权

人工智能、机器学习、深度学习专栏收录该内容

106 篇文章 9 订阅

订阅专栏

Transformer最具体形象的例子就是做机器翻译了，搞懂这个再去理解其他用Transformer做的下游任务就更方便了，比如时间序列预测，你搞不懂Encoder/Decoder的数据怎么喂进去的，怎么编码的，为什么编码，那不是就有点本末倒置了，基础都没get，现在的文章大部分都是直接给模型理解，没讲清楚整体流程，这篇文章的目的就是讲清楚整个流程。

链接1看Encoder-decoder如何机器翻译这个看懂了，再看森哥的Transformer，再看看官方开源代码，整体概念与实现细节就差不多了，多练，忘了回来反复看。

PPT看这个就够了

DeepLearning/9_RNN_6.pdf at master · wangshusen/DeepLearning · GitHub

视频看森哥就够了

RNN模型与NLP应用(7/9)：机器翻译与Seq2Seq模型_哔哩哔哩_bilibili基础流程还得看森哥的视频

参考资料

6_机器翻译与Seq2Seq模型_IT-cute的博客-CSDN博客

用Pytorch和transformer实现机器翻译_哔哩哔哩_bilibili//代码讲解

拆 Transformer 系列一：Encoder-Decoder 模型架构详解 - 知乎//讲特别清楚

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Transformer具体如何进行机器翻译

Transformer最具体形象的例子就是做机器翻译了，搞懂这个再去理解其他用Transformer做的下游任务就更方便了，比如时间序列预测，你搞不懂Encoder/Decoder的数据怎么喂进去的，怎么编码的，为什么编码，那不是就有点本末倒置了，基础都没get，现在的文章大部分都是直接给模型理解，没讲清楚整体流程，这篇文章的目的就是讲清楚整个流程。链接1看Encoder-decoder如何机器翻译这个看懂了，再看森哥的Transformer，再看看官方开源代码，整体概念与实现细节就差不多了，多练，忘了
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。