Exploring Self-attention for Image Recognition阅读笔记

最新推荐文章于 2022-08-28 13:33:46 发布

Ma lidong

最新推荐文章于 2022-08-28 13:33:46 发布

阅读量601

点赞数 1

分类专栏： Visual Transformer 文章标签：深度学习人工智能神经网络 transformer 原力计划

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41684249/article/details/115517880

版权

Visual Transformer 专栏收录该内容

9 篇文章 2 订阅

订阅专栏

CVPR 2020
Hengshuang Zhao, Jiaya Jia, Vladlen Koltun
https://arxiv.org/abs/2004.13621

一、简介

卷积具有两个功能。第一种是特征聚合，通过卷积核在特征图上进行卷积来融合特征的过程；第二种是特征变换，在卷积完成后进行一系列的线性和非线性变换（例如全连接层和激活函数）。

特征聚合和特征变换是可以解耦的，特征变换可以通过线性映射和非线性变换，因此我们将重点放在self-attention机制替代卷积用来特征聚集。

本文探索了两种self-attention的变体，一种是pairwise self-attention，另一种是patchwise self-attention。

二、Pairwise Self-attention

在这里插入图片描述

上式就是Pairwise Self-attention的数学公式，其中，⊙表示Hadamard product(矩阵的对应位置相乘)。

xi是特征图上的一个点，即一个n维向量。

R（i）表示一个以i为中心的邻域。

B是一种变换。

在这里插入图片描述

a（xi，xj）实际上就是求权重，δ函数是用来计算关系的。

γ={Linear→ReLU→Linear}，是为了解决维度匹配的问题。

此外还将位置i和位置j的坐标信息纳入到了a（xi，xj）中。

三、Pathwise Self-attention

在这里插入图片描述

上式就是Pathwise Self-attention的数学公式，其中，⊙表示Hadamard product(矩阵的对应位置相乘)。

Pairwise Self-attention和Pathwise Self-attention的区别在于，Pairwise Self-attention是用（xi和xj）配对的方式计算权重a，而Pathwise Self-attention是用整个区域来计算权重a。

在这里插入图片描述

四、整体结构

在这里插入图片描述

左侧计算函数a得到权重，右侧通过线性变换，然后使用Hadamard product聚合权重，从而得到组合特征。

组合的特征经过归一化和基本非线性处理，并由最终的线性层处理，该层将它们的维度扩展回C。

在这里插入图片描述

上图是以Pairwise Self-attention为例的具体流程图，其中关系函数使用Summation。

在这里插入图片描述

上图是SAN网络结构图。

五、实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
Exploring Self-attention for Image Recognition阅读笔记

CVPR 2020Hengshuang Zhao, Jiaya Jia, Vladlen Koltunhttps://arxiv.org/abs/2004.13621一、简介卷积具有两个功能。第一种是特征聚合，通过卷积核在特征图上进行卷积来融合特征的过程；第二种是特征变换，在卷积完成后进行一系列的线性和非线性变换（例如全连接层和激活函数）。特征聚合和特征变换是可以解耦的，特征变换可以通过线性映射和非线性变换，因此我们将重点放在self-attention机制替代卷积用来特征聚集。本文探索了两种s
复制链接

扫一扫

专栏目录

Ma lidong CSDN认证博客专家 CSDN认证企业博客

码龄6年

99: 原创

23万+: 周排名

55万+: 总排名

27万+: 访问

: 等级

2738: 积分

169: 粉丝

342: 获赞

120: 评论

1551: 收藏

私信

关注

热门文章

分类专栏

最新评论

pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
犯罪中止: 呃呃呃呃呃谢谢啊我关了之后立马好了我靠
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
yuli678: 应该是网络问题，我是把.whl文件下到本机上，再传到的服务器上，再进行安装的
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
giant2337: 我也是问问怎么解决的呀
pip安装库报错：WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))
giant2337: 您好，想问下怎么关翻墙代理啊
模式识别报告：HWDB1.1手写汉字识别
心平气和_: 您好！我按照您的步骤一步一步进行了，但是请问出现Traceback (most recent call last): File "train.py", line 117, in <module> train(epoch, net, criterion, optimizer, trainloader, writer=writer, scheduler=scheduler) File "train.py", line 60, in train loss = criterion(outputs, labels) File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/modules/loss.py", line 1150, in forward return F.cross_entropy(input, target, weight=self.weight, File "/root/miniconda3/lib/python3.8/site-packages/torch/nn/functional.py", line 2846, in cross_entropy return torch._C._nn.cross_entropy_loss(input, target, weight, _Reduction.get_enum(reduction), ignore_index, label_smoothing) RuntimeError: CUDA error: device-side assert triggered 这种报错是什么原因啊？该怎么修改呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ma lidong 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。