Attention机制学习笔记

最新推荐文章于 2024-09-27 16:57:59 发布

河南老♂乡唐可可

最新推荐文章于 2024-09-27 16:57:59 发布

阅读量679

点赞数

分类专栏： # 自然语言处理文章标签：学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SGDBS233/article/details/128986223

版权

自然语言处理专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Attention机制关注重点信息，减少计算资源消耗。在NLP中，它解决了长距离信息弱化的问题，允许模型在长文本中捕获关键点。通过查询、键和值的相似度计算，实现信息的加权选择。这种机制参数少、速度快，能并行处理，提高效率。

摘要由CSDN通过智能技术生成

学习自https://easyai.tech/ai-definition/attention/

Attention本质

Attention（注意力）机制如果浅层的理解，跟他的名字非常匹配。他的核心逻辑就是“从关注全部到关注重点”。

比如我们人在看图片时，对图片的不同地方的注意力是不同的。

即,我们的视觉系统就是一种 Attention机制，将有限的注意力集中在重点信息上，从而节省资源，快速获得最有效的信息。

Attention与NLP的联系
在这里插入图片描述

Attention的优点

参数少，与CNN，RNN相比，参数少，复杂度更低
速度快，Attention机制每一步计算不依赖于上一步的计算结果，因此可以和CNN一样并行处理。
在 Attention 机制引入之前，有一个问题大家一直很苦恼：长距离的信息会被弱化，就好像记忆能力弱的人，记不住过去的事情是一样的。

Attention 是挑重点，就算文本比较长，也能从中间抓住重点，不丢失重要的信息。下图红色的预期就是被挑出来的重点。

Attention原理

一个小小的例子,比如我想要更多的了解漫威，那么我就应该多读一读相关的书籍，与之关系不大的书就不用大量地看。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-46K93WJa-1676108183205)(./marvel.png)]

稍微具体化一点就是：图书管（source）里有很多书（value），为了方便查找，我们给书做了编号（key）。当我们想要了解漫威（query）的时候，我们就可以看看那些动漫、电影、甚至二战（美国队长）相关的书籍。不过为了提升效率，动漫、电影的书籍需要多看一下，而二战类的书籍就不需要看那么多了。

Attention具体流程

query 和 key 进行相似度计算，得到权值
将权值进行归一化，得到直接可用的权重
将权重和 value 进行加权求和

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WeNYtAUN-1676108183205)(./attention.png)]

河南老♂乡唐可可

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。