教你手撸Transformer

dllsy61

已于 2023-08-04 14:57:53 修改

阅读量345

点赞数 1

文章标签： transformer 深度学习人工智能 pytorch

于 2023-08-04 14:54:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dllsy61/article/details/132024594

版权

前言

Transformer是继mlp,cnn,rnn后的又一类神经网络模型，自提出以来，已经广泛应用与自然语言处理（NLP）与计算机视觉（CV）领域。作为从业者和工程师，又必要对这一前沿技术进行跟进学习。
互联网上关于Transformer的介绍和讲解多如牛毛，但是真正引人入胜的文章寥寥无几，大多数文章要么是低级的重复抄袭，不堪卒读。要么是只介绍Transformer中的一个小点，读来有种只见树木不见森林的感觉，容易使读者感觉盲人摸象，似是而非。还有一些非常不错的文章，但是又缺乏对应的可供试手的代码。
鉴于此，特写这个手撸Transformer的教程，既希望能帮助其它同学学习，也是对自己最近学习Transformer的一个总结。
本教程以jupyter notebook的形式发布，将理论介绍与对应代码相结合，方便读者学习参考。
在本教程中，将会介绍Transformer中的基本概念，然后逐模块地给出一个Transformer模型的实现，并在一个机器翻译数据集上训练Transformer，便于读者获得一个直观的感受。

教程地址

Transformer手把手教程

教程目录

1.Transformer介绍

2.Transformer中的核心概念

什么是embedding

什么是位置编码（Positional encoding）

什么是自注意力机制

什么是Feed Forward Network

关于网络结构的其它细节

3.从零构建Transformer

环境配置

embedding层的实现

位置编码层的实现

多头注意力Multi head attention层的实现

前馈神经网络的实现

编码器层的实现

编码器的实现

解码器层的实现

解码器的实现

最终的Transformer

4. 训练Transformer用作机器翻译

数据集加载

Tokenize与字典

构建数据集和DataLoader

学习率调度

训练

5. 测试

6. 总结

博客等级

码龄8年

8
原创

48
点赞

38
收藏

35
粉丝

关注

私信

热门文章

最新评论

记录使用pyinstaller时sys.executable的指向问题
innocent_coder: 然后该如何解决呢
jpeg图像压缩原理
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
easy-serve，一个简单的深度学习模型部署框架
CSDN-Ada助手: 恭喜你发布了第5篇博客！easy-serve这个深度学习模型部署框架听起来非常有用，期待能够了解更多关于这个框架的内容。同时也建议你可以在下一篇博客中，加入一些实际案例或者使用经验，让读者更容易理解和应用这个框架。希望你能够继续保持创作的热情，期待你的下一篇分享！
Pyqt5中的一些核心概念辨析
CSDN-Ada助手: 非常棒的博客！恭喜你写了第6篇博客，题目选择也很吸引人。你在解析Pyqt5中的核心概念方面做得很好，内容深入浅出，让读者容易理解。不过，我觉得你可以更进一步，给读者提供一些示例代码，以帮助他们更好地理解这些概念。希望你能继续保持创作的热情，期待看到更多精彩的博客！
Chat-Excel,当AI遇上Excel
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“Chat-Excel,当AI遇上Excel”听起来非常吸引人。您对AI和Excel的结合进行了探索，这无疑是一个十分有趣的话题。在这篇博客中，您可能会分享如何利用AI技术提升Excel在数据处理方面的效率，或者AI如何通过与Excel的交互提供更智能的数据分析功能等。我非常期待阅读您的博客，并从中学习到更多关于AI和Excel的知识。如果允许我提一个创作建议，或许您可以在博客中加入一些实际案例或示例，以便读者更好地理解您所讨论的主题。此外，您还可以考虑将AI与Excel结合的优势与限制进行对比，帮助读者更好地评估其实际应用价值。再次恭喜您的创作，并期待您未来更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。