python系列&deep_study系列:【李沐-动手学深度学习】一文读懂注意力机制




【李沐-动手学深度学习】一文读懂注意力机制

一文读懂注意力机制

本文依据李沐老师的书和课程进行更为具象化的讲解。
电子书《动手学深度学习》地址:https://zh-v2.d2l.ai/index.html
视频课程:【完结】动手学深度学习PyTorch版

1. 注意力机制的生物学原理

生物实验认为,人的行为活动受到视觉世界中“非自主性提示”和“自主性提示”的影响。

“非自主性提示” 指环境中物体的突出性和易见性。如在灰色的空间中,有一套红色咖啡杯具,我们会不由自主地把视力聚焦在突出和显眼的物品上:

在这里插入图片描述

图1 由于突出性的非自主性提示(红杯子),注意力不自主地指向了咖啡杯

“自主性提示” 一般指主观认识和意识控制。当我们想要看书时,自然会把注意力转移到书上:

在这里插入图片描述

图2 依赖于主观意志提示(想读一本书),注意力被自主引导到书上

此处延申出两个问题:

  1. 环境中的所有物体都会对注意力产生影响。

  2. 不同物品对于注意力的“吸引力“不同,导致注意力会关注某个物品。

下面我们将使用注意力模型解释,计算机如何理解“注意力”。

2. 注意力机制

2.1 非自主性提示

非自主性提示的建模,只需要对视觉下的不同“物体”赋予不同权重,那么在接收这些“物体”就会产生不同的偏向。
利用上面的例子,如果我们给红色的杯子赋予一个较大的权重(weight = 0.6),而其他物品赋予一个较小的权重(weight = 0.1),显然在获取信息时红杯子对我们造成的影响更大。
在这里插入图片描述
图3 非自主性提示

这一点通过简单的参数化全连接层就可以实现,而我们的重点在于自主性提示

2.1 自主性提示
查询、键和值

在注意力机制的背景下,自主性提示 (想要关注什么) 被称为查询(query),非自主性提示 (环境中的物体) 被称为键(key),感官输入 (在我的认知中,该物体的定义) 被称之为值(value)。

Key与Value容易混淆,这里举例说明:

  • Key是环境中的客观物体,通常它带有一些客观属性,如红色+红色杯垫+咖啡杯是这个物体的属性。

  • Value是我们的主观意识,如该咖啡杯在我们的意识里是一个独特的精致的红杯子,那么“独特的精致的精致的”就是主观意识。(每个人对于客观物体的主观意识不同,因此Key的Value可以相同也可以不同

注意力计算

在带有主观目的(query)进行观察时,首先将查询(query)与环境中的物体(key)做匹配,最终会输入匹配度最高的物体的属性(value)作为最终输出:

在这里插入图片描述

下一章,我们将从代码着手,逐行解释注意力机制是如何实现的。







https://blog.csdn.net/qq_51600482?type=blog添加链接描述

【李沐-动手学深度学习】一文读懂注意力机制

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坦笑&&life

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值