transformer&swin t

一拳一个嘤嘤嘤怪

已于 2023-11-27 16:34:49 修改

阅读量177

点赞数

文章标签： python

于 2023-08-14 21:00:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42719217/article/details/132210896

版权

是这篇讲解的一些学习记录：https://zhuanlan.zhihu.com/p/338817680

1、Transformer：深度学习网络，不使用卷积层（CNN）或循环层（RNN）进行序列到序列的转换。

不存在循环结构，可以并行计算，提高计算效率

它由 Encoder 和 Decoder 两个部分组成，Encoder 和 Decoder 都包含 6 个 block（子网络）

词Embedding：向量映射/向量化，是每一个维度对应词的一个语义特征，由算法预训练或transformer训练得到

位置Embedding：单词在序列中的相对或绝对位置

2、Self-Attention（自注意力机制）

Add & Norm 层由 Add 和 Norm 两部分组成；

Add 表示残差连接 (Residual Connection) 用于防止网络退化；让网络只关注当前差异的部分，在 ResNet 中经常用到。

Norm 表示 Layer Normalization（归一化层），用于对每一层的激活值进行归一化。通常用于 RNN 结构，Layer Normalization 会将每一层神经元的输入都转成均值方差都一样的，这样可以加快收敛。

softmax计算每一个单词对于其它单词的注意力系数，即对每一行进行softmax（每一行归一化，和为1）

Multi—head attention：（这里跟原作者讲述的不同）首先通过h次（h=8）不同线性变换，生成8组Q，K，V，然后将每个位置512维度分成8个head，每个head 64维度，然后做8次Self attention，得到8个输出矩阵，最后拼接（变成512维）传入linear得到最终结果。

3、Swin Transformer

参考链接：https://blog.csdn.net/qq_39478403/article/details/120042232

整体架构：

Patch Partition和Linear Embeding就是直接通过一个卷积层实现，stage2、3、4在Patch Merging层进行下采样。

block结构：

相比于 Transformer block，将标准多头自注意力模块 (MSA) 替换为基于移位窗口的多头自注意力模块 (W-MSA / SW-MSA) 。MSA后面的MLP：带有非线性 GeLU 激活函数在中间的 2 层 MLP

计算复杂度参考：swin transformer详解 - 知乎 (zhihu.com)

一拳一个嘤嘤嘤怪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

一拳一个嘤嘤嘤怪 CSDN认证博客专家 CSDN认证企业博客

码龄6年

14: 原创

32万+: 周排名

81万+: 总排名

3万+: 访问

: 等级

198: 积分

12: 粉丝

18: 获赞

17: 评论

188: 收藏

私信

关注

热门文章

最新评论

安装MMDetection3D的各种坑
m0_65506613: 哥，我听了你的意见，一个一个去修改，直到/usr/local/cuda/targets/x86_64-linux/include/cusparse.h:52:10: fatal error: cuComplex.h: 没有那个文件或目录 52 | #include <cuComplex.h> 这个是不可修改文件，咋搞
BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View Representation复现
wdf159: 大佬我在下载预训练权重时先提示HTTP request sent, awaiting response... 301 Moved Permanently而后报错HTTP request sent, awaiting response... 404 Not Found，大致意思是所请求的资源已经被永久移动到了一个新的URL，这怎么解决啊
海康工业相机参数设置（python）
万里生云雾: 大佬能加个好友请教一下嘛，我要被这个搞疯了
海康工业相机参数设置（python）
万里生云雾: 大佬能加个好友请教一下嘛，我要被这个搞疯了
海康工业相机参数设置（python）
Jin·: 我也不知道原理但是不需要获取触发状态设置硬出发后主动取流可以直接拿到图片，前提需要在海康的MVS中设置触发方式和电平值

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。