注意力机制

非浪得虚名

已于 2024-06-13 10:30:38 修改

阅读量922

点赞数 33

文章标签：自然语言处理深度学习人工智能 transformer

于 2024-06-13 10:04:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41476714/article/details/139644740

版权

文章目录

定义

注意力（Attention）机制是神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重，同时减弱其他部分的权重，将关注点聚焦于数据中最重要的部分。本质是从关注全部到关注重点。

Attention 机制最早应用于计算机视觉领域，随后应用于NLP 领域，因2018 年 BERT 和 GPT 在NLP任务处理的优异性而走红

在这里插入图片描述

Attention在NLP中的位置

举个例子来类比注意力机制和人类注意力。假设你站在一条步行街，你的视野范围内有许许多多的事物（人、门店、路灯、地砖等等），你会被比较光鲜亮丽的事物吸引眼球，也会因为自己的需求关注某些事物（比如你想找个饭店，那么你就会关注门店牌匾），但无论哪种方式，你眼里的所有的事物的重要程度肯定是不一样的。而注意力机制就是模仿这一个过程，给定输入序列，识别出序列中的重要信息。

原理

需要说明的是，Attention计算方式有多种，常见的有缩放点积、加性和相对位置编码的点积注意力等，这里以最常见的缩放点积注意力为例。

注意力机制的原理主要涉及三个矩阵Q、K和V变换和相互计算。首先我们输入数据X，再对X进行三个线性变换得到Q、K和V矩阵，分别对应查询、键、值矩阵。最后再用这三个矩阵计算注意力得分。具体过程如下：

输入表示：输入序列为矩阵X，X的每一行表示输入序列中的一个词或一个时间步的向量。
通过线性变换得到Q、K和V矩阵。WQ、Wk和Wv是可训练的权重矩阵，分别用于将输入向量投影到查询、键和值的空间。
计算注意力得分。通过点积计算每个查询向量与所有键向量之间的相似度，得到注意力得分矩阵。

为更进一步了解注意力机制的原理，我们提出三个问题，并一一回答。
Q、K、V的物理意义是什么？
为什么要对输入数据X进行线性变换？

最低0.47元/天解锁文章

非浪得虚名

关注

33
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
注意力机制

注意力（Attention）机制是神经网络中一种模仿认知注意力的技术。这种机制可以增强神经网络输入数据中某些部分的权重，同时减弱其他部分的权重，将关注点聚焦于数据中最重要的部分。本质是从关注全部到关注重点。 Attention 机制最早应用于计算机视觉领域，随后应用于NLP 领域，因2018 年 BERT 和 GPT 在NLP任务处理的优异性而走红
复制链接

扫一扫

非浪得虚名 CSDN认证博客专家 CSDN认证企业博客

码龄7年

21: 原创

74万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

383: 积分

124: 粉丝

160: 获赞

6: 评论

150: 收藏

私信

关注

热门文章

分类专栏

Java体系学习 1篇
环境安装问题

最新评论

爬取数据时，HTTP ERROR 401解决办法
CSDN-Ada助手: 恭喜您写了第16篇博客！解决HTTP ERROR 401的问题对于数据爬取来说确实是一个重要的技巧。接下来，我建议您可以尝试探讨更多关于数据爬取过程中可能遇到的其他常见错误及解决方法，这样能够帮助更多人更好地应对类似情况。期待您的下一篇作品！祝您创作顺利！
特征工程-特征提取
CSDN-Ada助手: 恭喜用户撰写了第15篇博客《特征工程-特征提取》，内容相信对读者们会有很大的帮助。在特征工程这个领域里，特征提取是非常重要的一环，你的文章对于这一部分的深入探讨无疑是非常有价值的。希望你能够继续保持创作的热情，不断学习和探索，也可以考虑结合实际案例或者应用场景来进行更深入的分析，这样读者们会更容易理解和接受你的观点。期待你未来更多精彩的创作！愿你在探索特征工程领域的道路上越走越远，越走越宽广！
使用wkhtmltopdf包将html转pdf的时候，图片不显示问题
CSDN-Ada助手: 恭喜您发布了第14篇博客！看到您分享关于使用wkhtmltopdf包转换html到pdf时遇到的图片显示问题，感觉收获颇丰。或许下一步可以尝试探索其他PDF转换工具，或者深入研究解决图片显示问题的更多方法，期待您的进一步探索和分享。希望您能继续保持创作的热情，谦虚虚心地学习与分享！
软件工程之数据类项目开发
阿J~: 大佬，一给我嘞giao
Push时出现“git@github.com: Permission denied (publickey).”
water___Wang: 学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。