Transformer 小白学习笔记

最新推荐文章于 2024-08-03 21:32:51 发布

这个豆丁明明超强

最新推荐文章于 2024-08-03 21:32:51 发布

阅读量34

点赞数

文章标签： transformer 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64067123/article/details/134743782

版权

一、Transformer的由来

针对传统时序网络（RNN，LSTM），首先RNN的记忆长度有限，因此产生了LSTM。但无论是RNN还是LSTM，它们的计算都无法并行化（即只能先计算t0时刻的数据，再计算t1时刻的数据，可以简单理解为前一步的输出是后一步的输入），计算效率不高；基于此Transformer闪亮登场，解决了传统时序网络无法并行化计算的问题。

二、注意力机制

在介绍Transformer之前，需要补充一下关于注意力机制的问题：

注意力机制的灵感来源于人类的视觉系统，即在处理信息时，人会把自己的注意力更多地集中在感兴趣的地方，比如你看一篇文章，第一眼看过去你可能更多地把目光集中在文章的题目上，或者作者署名等等这些地方。又或者你看到迎面走来一个穿着很亮眼的人，那你的目光可能就会更多地集中在他的衣着上，这就是人类的视觉注意力机制。

在深度学习中，注意力机制允许模型在处理输入序列时，对不同位置的信息分配不同的权重，从而使模型更加关注重要的部分，这有利于提高模型的性能，特别是在处理长序列或者复杂关系的任务中。

这个豆丁明明超强

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Transformer 小白学习笔记

针对传统时序网络（RNN，LSTM），首先RNN的记忆长度有限，因此产生了LSTM。但无论是RNN还是LSTM，它们的计算都无法并行化（即只能先计算t0时刻的数据，再计算t1时刻的数据，可以简单理解为），计算效率不高；基于此Transformer闪亮登场，解决了传统时序网络无法并行化计算的问题。
复制链接

扫一扫

这个豆丁明明超强 CSDN认证博客专家 CSDN认证企业博客

码龄3年

27: 原创

122万+: 周排名

12万+: 总排名

7771: 访问

: 等级

426: 积分

117: 粉丝

155: 获赞

10: 评论

70: 收藏

私信

关注

热门文章

最新评论

【LeetCode】每日一题：使二叉树所有路径值相等的最小代价
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
casadi安装全流程
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
C++学习进阶版（持续更新中）
CSDN-Ada助手: 恭喜您写了第17篇博客！标题为“C++学习进阶版（持续更新中）”，真是令人印象深刻。持续创作博客不仅能够展示您的学习成果，还能够帮助他人更好地理解C++。如果我可以提供一些建议的话，我建议您在下一步的创作中，可以考虑分享一些实践经验或者深入的技术应用，这样能够让读者更加全面地了解C++的学习和应用。再次恭喜您，并期待您的持续更新！
【LeetCode】每日一题：用邮票贴满网格图——2023.12.14
CSDN-Ada助手: 恭喜用户继续坚持创作，写下了第18篇博客！标题看起来非常吸引人，题目似乎很有趣。我希望能够看到您在解题过程中的思考和解决方案。如果可能的话，我建议您在博客中添加一些具体的示例或者步骤，这样读者可以更好地理解您的思路。期待您未来更多的创作！
【LeetCode】每日一题：可获得的最大点数——2023.12.3
CSDN-Ada助手: 恭喜您完成了第12篇博客！看到您每天都坚持写LeetCode题解，我真的非常惊叹您的毅力和努力。对于这篇题目《可获得的最大点数》，您给出了很好的解答。希望您能继续保持这种创作动力，为我们带来更多有趣且有深度的题解。不过，如果可能的话，我希望您能在文章中分享一些自己的思考过程或者优化技巧，这样对于读者来说也能更有参考价值。再次感谢您的分享，期待您的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。