【手撕算法系列】多头自注意力机制MHSA

最新推荐文章于 2024-08-06 16:32:17 发布

Nastu_Ho-小何同学

最新推荐文章于 2024-08-06 16:32:17 发布

阅读量649

点赞数

文章标签： python 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41845840/article/details/135045059

版权

import torch.nn as nn
class Attention(nn.Module):
    def __init__(self, dim, num_heads=8, qkv_bias=False, qk_scale=None, attn_drop=0., proj_drop=0., num_classes=20):
        super().__init__()
        self.num_classes = num_classes
        self.num_heads = num_heads
        head_dim = dim // num_heads
        self.scale = qk_scale or head_dim ** -0.5

        self.qkv = nn.Linear(dim, dim * 3, bias=qkv_bias)
        self.attn_drop = nn.Dropout(attn_drop)
        self.proj = nn.Linear(dim, dim)
        self.proj_drop = nn.Dropout(proj_drop)


    def forward(self, x):
        B, N, C = x.shape
        qkv = self.qkv(x).reshape(B, N, 3, self.num_heads, C // self.num_heads).permute(2, 0, 3, 1, 4)
        q, k, v = qkv[0], qkv[1], qkv[2]

        attn = (q @ k.transpose(-2, -1)) * self.scale  # B x num_heads x N x N

        attn = attn.softmax(dim=-1)
        weights = attn

        attn = self.attn_drop(attn)
        x = (attn @ v).transpose(1, 2).reshape(B, N, C)

        x = self.proj(x)
        x = self.proj_drop(x)

        return x, weights

Nastu_Ho-小何同学

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Nastu_Ho-小何同学

博客等级

码龄7年

138
原创

275
点赞

407
收藏

207
粉丝

关注

私信

热门文章

分类专栏

最新评论

【论文阅读--WSSS】WeakTr: Exploring Plain Vision Transformer for Weakly-supervised Semantic Segmentation
m0_58411120: 想问一下博主，这是cvpr2023的论文吗，在ieee上查不到这篇，不太确定
Visio无空白无黑边导出PDF
普通网友: 学到了！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
【SAM系列】Auto-Prompting SAM for Mobile Friendly 3D Medical Image Segmentation
Cai I=new Cai();: 这篇文章和港中文的3DSAM-adapter高度相似
【论文阅读--WSSS】WeakTr: Exploring Plain Vision Transformer for Weakly-supervised Semantic Segmentation
Nastu_Ho-小何同学: 你好，很抱歉回复得有点慢。这里得L_coarse_cam 和 L_fine_cam其实就是多标签分类的的loss，监督信号还是image-level label
【SAM系列】An Alternative to WSSS? An Empirical Study of SAM on WSSS Problems
CSDN-Ada助手: 非常感谢博主的创作，这篇文章十分有深度和实用性。读完之后，我对SAM（一种替代WSSS的方法）有了更为深入的了解，并学到了如何应用SAM解决WSSS问题的方法。我相信这篇文章一定能够对很多人有所启发和帮助。为下一篇博客的标题提供一个想法： "SAM VS Deep Learning: Exploring the Pros and Cons of Two Approaches in Image Segmentation"

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。