attention注意力机制【对应图的代码讲解】

最新推荐文章于 2024-08-01 03:46:21 发布

365JHWZGo

最新推荐文章于 2024-08-01 03:46:21 发布

阅读量2.7k

点赞数 2

分类专栏：实践中的细节文章标签： python 深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44833392/article/details/121941547

版权

实践中的细节专栏收录该内容

25 篇文章 2 订阅

订阅专栏

文章目录

题目

'''
Description: attention注意力机制
Autor: 365JHWZGo
Date: 2021-12-14 17:06:11
LastEditors: 365JHWZGo
LastEditTime: 2021-12-14 22:23:54
'''

注意力机制三步式+分步代码讲解

在这里插入图片描述

导入库

import torch 
import torch.nn as nn
import torch.nn.functional as F

Attn类

class Attn(nn.Module):
    def __init__(self,query_size,key_size,value_size1,value_size2):
        super(Attn,self).__init__()
        self.query_size = query_size
        self.key_size = key_size
        self.value_size1 = value_size1
        self.value_size2 = value_size2
        
        self.attn = nn.Linear(self.query_size+self.key_size,value_size1)
    
    def forward(self,q,k,v):
        
        # attn_weights=(1,32)
        attn_weights = F.softmax(self.attn(torch.concat((q[0],k[0]),1)),dim=1)
        # attn_weights.unsqueeze(0)=(1,1,32)
        # v=(1,32,64)
        # attn_applied=(1,1,64)
        output = torch.bmm(attn_weights.unsqueeze(0),v)
        
        return output,attn_weights

attn函数是将合成【Query｜Key】，进行列合并
$f(Q,K) = W_a[Q,K]$

attn_weights的结果对应于a1,a2,a3…
在这里插入图片描述
output是计算Attention Value，bmm相当于a1value1+a2value2+…【矩阵乘法】

if __name__ == "__main__":
    query_size = 32
    key_size = 32
    value_size1 = 32
    value_size2 = 64
    
    attn = Attn(query_size, key_size, value_size1, value_size2)
    Q = torch.randn(1,1,32)
    K = torch.randn(1,1,32)
    V = torch.randn(1,32,64)
    out = attn(Q, K ,V)
    print(out[0])
    print(out[1])

运行结果

在这里插入图片描述

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

365JHWZGo CSDN认证博客专家 CSDN认证企业博客

码龄6年

545: 原创

2万+: 周排名

2万+: 总排名

40万+: 访问

: 等级

5802: 积分

5829: 粉丝

199: 获赞

140: 评论

710: 收藏

私信

关注

热门文章

分类专栏

最新评论

《论文阅读》常识感知的提示用于可控的同情对话生成 2023
365JHWZGo: 抱歉，已更正来源
《论文阅读》常识感知的提示用于可控的同情对话生成 2023
Ec.ho: hello,我想问一下这个论文的具体出处，我在AAAI23上没找到
《论文阅读》通过顺序不敏感的表示正则化实现稳健的个性化对话生成 ACL 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》具有人格自适应注意的个性化对话生成 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《论文阅读》学习了解自己：一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

365JHWZGo 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。