对于注意力机制的理解

最新推荐文章于 2024-09-26 17:20:50 发布

七七鸭灬

最新推荐文章于 2024-09-26 17:20:50 发布

阅读量276

点赞数 4

分类专栏：深度学习理论文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-NC-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35768355/article/details/140860141

版权

深度学习理论专栏收录该内容

8 篇文章 0 订阅

订阅专栏

PS：这是我对注意力机制的一些理解不一定保真，为防止日后遗忘，也为了互相学习，故写下此篇文章，如果有误欢迎在评论区中指出，咱们互相进步。

什么是注意力机制

注意力机制是指模型不会同时关注输入特征的所有细节，而是有选择性地聚焦于输入特征的某些特定的部分，而忽略其他不那么重要的信息这有助于更有效地处理信息。

注意力机制的原理

注意力机制中先分别初始化QKV的权重矩阵Wq,Wk,Wv,然后将输入X分别与这三个权重矩阵点乘从而获得三个向量：查询（Query，Q）、键（Key，K）和值（Value，V）

然后，计算Q和K的点积来计算查询向量和键向量之间的相似度得分，但是为了防止这个值太大，还需要除于根号键K的维度，然后对得到的得分应用softmax函数，将其转化为概率分布，即注意力权重

最后我们将得到的注意力权重和值V相乘得到最终的注意力输出

什么是自注意力机制

自注意力是注意力机制中的一种，它是特点是注意力机制中的QKV全部来自同一个输入，这允许每个序列元素都能够参考序列中所有其他元素的信息，让模型能够注意到整个输入中不同部分之间的相关性，并将相关部分的权重提高，从而保留相关的部分（这在自然语言处理中叫上下文理解，在图像处理中能解决意外引进的噪音）。

自注意力机制的作用

在自然语言处理中能够帮助实现上下文理解，在图像处理中可以帮助模型识别图像中不同区域之间的关系，从而更有效地聚合全局和局部特征。

自注意力机制的缺点

自注意力机制的原理是筛选重要信息，过滤不重要信息，这就导致其有效信息的抓取能力会比CNN小一些。这是因为自注意力机制相比CNN，无法利用图像本身具有的尺度，平移不变性，以及图像的特征局部性（图片上相邻的区域有相似的特征，即同一物体的信息往往都集中在局部）这些先验知识，只能通过大量数据进行学习。这就导致自注意力机制只有在大数据的基础上才能有效地建立准确的全局关系，而在小数据的情况下，其效果不如CNN

什么是交叉注意力机制

交叉注意力是注意力机制中的一种，它是特点是注意力机制中的Q是查询的条件，KV是被查询的对象，这允许网络融合多模态的输入，或者根据外部输入的条件去指导网络的输出。

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

七七鸭灬 CSDN认证博客专家 CSDN认证企业博客

码龄8年

40: 原创

9706: 周排名

2万+: 总排名

25万+: 访问

: 等级

1146: 积分

6704: 粉丝

562: 获赞

147: 评论

1284: 收藏

私信

关注

热门文章

分类专栏

最新评论

windows系统下如何确认CUDA和CUDNN都安装成功了
里见: 把哪两个程序拖到命令行中运行
YOLO10+OCR识别电子发票的指定文字内容
坚持不懈的ape: 佬，yolo直接代替掉ppocr的检测部分可以吗［如果可以这两部分怎么连接，数据集能共用吗］？yolo分类的作用在哪里呢，按一个类别比如text后面也不会影响到ppocr的识别吧。
CUDA11.6、CUDA11.3、CUDA10.2、CUDA9.0安装包（windows10）[CUDA和Pytorch版本对应表][附带对应版本cudnn][百度云链接下载]
m0_55908249: 感谢作者，我从官网一直下不下来
2023年最新Ubuntu安装pytorch教程
qq_68834451: 请问为什么安装pytorch一样的版本报了下面的错 Solving environment: failed with initial frozen solve. Retrying with flexible solve. Collecting package metadata (repodata.json): / WARNING conda.models.version:get_matcher(528): Using .* with relational operator is superfluous and deprecated and will be removed in a future version of conda. Your spec was 1.8.0.*, but conda is ignoring the .* and treating it as 1.8.0 WARNING conda.models.version:get_matcher(528): Using .* with relational operator is superfluous and deprecated and will be removed in a future version of conda. Your spec was 1.6.0.*, but conda is ignoring the .* and treating it as 1.6.0 WARNING conda.models.version:get_matcher(528): Using .* with relational operator is superfluous and deprecated and will be removed in a future version of conda. Your spec was 1.9.0.*, but conda is ignoring the .* and treating it as 1.9.0 done
YOLO10+OCR识别电子发票的指定文字内容
Leogiao: 使用paddleocr的时候，需要在另外一个虚拟环境里吧？那怎么将yolo识别的结果引入到ocr识别中呢？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

七七鸭灬 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。