注意力机制

二三两。

已于 2024-07-15 09:52:28 修改

阅读量381

点赞数 9

分类专栏：知识点梳理文章标签：全文检索

于 2024-01-15 14:17:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47182555/article/details/135598425

版权

知识点梳理专栏收录该内容

4 篇文章 0 订阅

订阅专栏

注意力机制是一种大脑处理选择性信息的重要方式，应用于驾驶、视觉识别等领域。在CV中，通过QKV技术，模型聚焦于任务相关区域，提高处理效率。注意力权重的均匀性有助于模型处理全局信息。

摘要由CSDN通过智能技术生成

注意力机制

是指大脑对外界刺激进行选择性处理和加工的一种神经过程。它包括注意的定向、分配、维持和转移等多个方面，以确保个体能够有效地处理和应对外部环境的信息。

举例

当一个人在驾驶汽车时，注意力机制会帮助他集中精力在道路上的车辆、行人和交通信号等关键信息上，以确保安全驾驶；

在一个拥挤的商场中，个体的注意力机制会帮助他们忽略周围的嘈杂声音和其他干扰，集中关注他们所感兴趣的商品或目标；

在CV中，经过Attention后，会将图片集中在任务相关的区域或特征上，从而使模型能够更好的理解和处理图片数据，如下图。

关联度计算

在注意力机制中，QKV代表查询（Query）、键（Key）和数值（Value），是一种用于处理输入数据的技木。这种技术最初是在自然语言处理和神经网络中被广泛应用的。

-查询（Query）：查询是指当前需要进行处理的信息。在注意力机制中，查询通常是一个向量，代表了需要进行关注和处理的特定信息。

-键（Key）：键是指用于比较查询和数值的信息。在注意力机制中，键也是一个向量，用于与查询进行比较，以确定查询与数值的相关性。

- 数值（Value）：数值是指需要被关注和处理的信息。在注意力机制中，数值也是一个向量，代表了与查询相关的信息。

在注意力机制中，通过比较查询和键的相关性，可以确定哪些数值与查询相关联，然后根据这种相关性对数值进行加权，以产生最终的输出。这种机制可以帮助模型在处理复杂的输入数据时，更加有效地关注和处理与特定查询相关的信息。

$Attention\left ( Q,K,V \right )= softmax\left ( \frac{QK^{T}}{\sqrt{d}} \right )V$

其中：除 $\sqrt{d}$ 可以使得点积的结果在不同维度下更加稳定，确保计算出来的注意力权重不受维度大小的影响，有助于保持注意力权重的均匀性，使得模型更容易学到全局的信息。

可以理解为得到的矩阵A是每个字之间的注意力权重，得到的矩阵B是在原矩阵上加上了注意力权重的矩阵

红框中“三个矩阵”：为Wq，Wk，Wv，都是可训练的（trainable）

（如有不当理解请指正！）

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
注意力机制

是指大脑对外界刺激进行选择性处理和加工的一种神经过程。它包括注意的定向、分配、维持和转移等多个方面，以确保个体能够有效地处理和应对外部环境的信息。当一个人在驾驶汽车时，注意力机制会帮助他集中精力在道路上的车辆、行人和交通信号等关键信息上，以确保安全驾驶；在一个拥挤的商场中，个体的注意力机制会帮助他们忽略周围的嘈杂声音和其他干扰，集中关注他们所感兴趣的商品或目标；经过Attention后，会将图片上，从而使模型能够更好的理解和处理图片数据，如下图。
复制链接

扫一扫

专栏目录

二三两。 CSDN认证博客专家 CSDN认证企业博客

码龄4年

11: 原创

107万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

358: 积分

164: 粉丝

206: 获赞

15: 评论

216: 收藏

私信

关注

热门文章

分类专栏

论文解读 7篇
知识点梳理 4篇

最新评论

Quality-aware Pre-trained Models for Blind Image Quality Assessment
二三两。: 我也不是很懂，文中好像没有描述质量分数是怎么得来的，只描述了他选用的损失函数（如果没有看漏的话）。我觉得应该是通过学习特征表示质量，然后损失函数进一步优化特征相对应的权重，进而更好的表示特征。
Quality-aware Pre-trained Models for Blind Image Quality Assessment
Immortal stars: 你好博主想问一下这个论文中图像质量分数是如何得到的训练的时候不需要mos主观评分的是吧测试推理的时候是如何量化图像质量的论文中During test stage, we take five crops (i.e., four corners and a center patch) from an image, and average their corresponding prediction scores to get the final prediction score. 这个prediction score不太理解通过什么来得到的！！！
CS-Net: Deep Multibranch Network Considering Scene Features for Sharpness Assessment of Remote Sensi
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
CS-Net: Deep Multibranch Network Considering Scene Features for Sharpness Assessment of Remote Sensi
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
CS-Net: Deep Multibranch Network Considering Scene Features for Sharpness Assessment of Remote Sensi
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

二三两。 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。