Transformer encoder层的使用

最新推荐文章于 2024-07-13 10:23:06 发布

zybdb_0827

最新推荐文章于 2024-07-13 10:23:06 发布

阅读量1.3k

点赞数 1

文章标签： python pytorch 深度学习 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51518257/article/details/127710071

版权

今天，由于实验需要，所以要尝试encoder层的使用，但是呢，发现两个问题：

1.许多人的实现都是不一致的，有的人qkv是直接用x赋值，有的人是全连接层，有的人是矩阵乘积，后面两个应该是一个意思，但是第一个我是看不懂的。

2.正常的tansformer-encoder是三维数据输入（batchsize，seq，feature）或者是位置不同，而我的是（batchsize，feature）这需要想一想改如何转换。

首先看，vit_pytorch这个不错的开源库中的实现

解析：

首先大的架构是，根据depth调整encoder个数，先进行layernorm，再输入到attention层，然后再与输入前的x相加，得到结果后进行layernorm，输入到feedforward，再加上之前的x。

或许print出来layers更加清晰

其中，我的问题是layernorm为什么是在输入前实现呢，跟原版bert编码器的并不是很一样，不过其实也不是很影响，然后多头的矩阵实现是挺有意思的，可以之后多研究研究。

最终我采用的方案是：将feature，reshape成一个二维的矩阵输入。其实还有fackbook的fairseq框架和pytorch官方实现的encoder，但其实都大差不差，因为已经解决了，我就不继续深入，后续有时间可以继续研究。

相关资料：

pytorch：TransformerEncoder — PyTorch 1.13 documentation

Vit-pytorch：lucidrains/vit-pytorch: Implementation of Vision Transformer, a simple way to achieve SOTA in vision classification with only a single transformer encoder, in Pytorch (github.com)

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

zybdb_0827 CSDN认证博客专家 CSDN认证企业博客

码龄4年

24: 原创

131万+: 周排名

16万+: 总排名

2万+: 访问

: 等级

304: 积分

51: 粉丝

34: 获赞

6: 评论

75: 收藏

私信

关注

热门文章

最新评论

raid磁盘阵列概念
CSDN-Ada助手: 恭喜您撰写了第20篇博客，题为“RAID磁盘阵列概念详解”！您的持续创作令人赞叹。您对RAID技术的深入探索以及对磁盘阵列的详尽解释使读者受益良多。在未来的创作中，或许您可以考虑进一步探讨RAID在不同应用场景下的优劣势，或者分享一些实际案例以加深读者的理解。期待看到更多精彩的博客！
docker 已经打包好镜像后如何修改时区
CSDN-Ada助手: 恭喜您写了第18篇博客！标题看起来很有意思，我很期待阅读您的文章。关于修改Docker镜像的时区，我相信您一定有独到的见解和实用的技巧。如果可以的话，我希望在您的文章中能够看到一些实例或者示范，以便更好地理解和应用。另外，我也想建议您可以考虑写一些关于Docker其他方面的文章，比如容器网络、存储管理等等。期待您的下一篇创作，谢谢您的分享！
使用python-docx 将所有绿色字符转为空格
CSDN-Ada助手: 恭喜您撰写了第15篇博客，阐述如何使用python-docx 将所有绿色字符转为空格，这是一个非常有用的技巧。接下来，我建议您可以考虑分享更多类似的技术，或者介绍一些实用的工具和软件，以便更多读者可以受益。感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply15 看奖励名单。
python matlibplot时如何不显示图片只保存图片
zybdb_0827: 有问题你就直说，我能通过这个方法实现你不能就说我坑吗？
python matlibplot时如何不显示图片只保存图片
名字什么的不重要！主要看脸: 大哥你真坑

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。