ConviT中GPSA位置注意力

最新推荐文章于 2024-06-06 15:55:14 发布

Dream Algorithm

最新推荐文章于 2024-06-06 15:55:14 发布

阅读量185

点赞数 2

文章标签： pytorch python 深度学习神经网络 transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A2321161581/article/details/128044962

版权

def get_rel_indices(self, num_patches: int) -> torch.Tensor:
        img_size = int(num_patches ** .5)
        rel_indices = torch.zeros(1, num_patches, num_patches, 3)
        ind = torch.arange(img_size).view(1, -1) - torch.arange(img_size).view(-1, 1)
        indx = ind.repeat(img_size, img_size)
        indy = ind.repeat_interleave(img_size, dim=0).repeat_interleave(img_size, dim=1)
        indd = indx ** 2 + indy ** 2
        rel_indices[:, :, :, 2] = indd.unsqueeze(0)
        rel_indices[:, :, :, 1] = indy.unsqueeze(0)
        rel_indices[:, :, :, 0] = indx.unsqueeze(0)
        device = self.qk.weight.device
        return rel_indices.to(device)

首先由torch.arange(img_size).view(1,-1) - torch.arange(img_size).view(-1,1)

产生绝对位置编码如[[0,1,2,3,4,5,6,7,8,9,10,11,12,13]

[-1,0,1,2,3,4,5,6,7,8,9,10,11,12]

[-2,-1,0,1,2,3,4,5,6,7,8,9,10,11]

...

...

[-13,-12,-11,-10,-9,-8,-7,-6,-5,-4,-3,-2,-1,0]

然后用repeat函数对绝对位置进行重复产生N*2的位置编码

[[0,1,2,3,4,5,6,7,8,9,10,11,12,13,0,1,2,3,4,5,6,7,8,9,10,11,12,13,0,1,2,3,4,5,6,7,8,9,10,11,12,13...]

...

对两个维度进行同样的操作

再用repeat_interleave函数对绝对位置进行重复，产生N*2的位置编码

[[0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,...]

[-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,-1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,...]

...]

第三种编码方式是由上面两种方式组合起来的indd = indx**2 + indy**2

然后将三种编码方式cat起来，通过一个映射将3通道映射成num_heads个数，这么做的原因是，多头注意力要进行head个头数的注意力，需要head个注意力矩阵，同个将三通道的位置矩阵映射成heads个，然后reshape成和多头注意力矩阵形状相同的矩阵，以便和多头注意力矩阵进行结合。

Dream Algorithm

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
ConviT中GPSA位置注意力

ConViT注意力机制GPSA详解
复制链接

扫一扫

Dream Algorithm CSDN认证博客专家 CSDN认证企业博客

码龄3年

37: 原创

118万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

511: 积分

45: 粉丝

117: 获赞

14: 评论

211: 收藏

私信

关注

热门文章

最新评论

特征增强自蒸馏卷积神经网络
sw10124: 不亏是石老师高徒，太厉害了
使用grad_cam生成自己的模型的热力图
weixin_43912852: 请问target_category = 4这个是什么来填写的，数据集里面没有这个
使用grad_cam生成自己的模型的热力图
weixin_48008327: 这段代码报错怎么办呢？ output = output[0] # 注意：如果模型是多输出，需要选择自己想要的输出 for i in range(len(target_category)): loss = loss + output[i, target_category[i]] 报错内容：RuntimeError: grad can be implicitly created only for scalar outputs
使用grad_cam生成自己的模型的热力图
我家楼下有条狗: 博主您好，请问这个代码可以实现在yolo上的gradcam图输出吗
Mathtype中Max、Min无法斜体解决
CSDN-Ada助手: 非常感谢您的分享！解决技术问题并分享经验是博客的精髓所在。既然您已经成功解决了Mathtype中Max、Min无法斜体的问题，为什么不写一篇详细的技术博文分享给更多的人呢？我建议您写一篇关于Mathtype常见问题解决方法的博客，可以涵盖一些像这个问题一样的技术小疑问，通过提供解决方案帮助其他用户更好地应用Mathtype。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。