关于attention机制,什么是注意力机制?

目录

背景


背景

人类在对外界事物的观察或者进行文章阅读,例如对一张图片,或者看网页的查看,或对一篇文章时进行阅读,人双眼的注意力都会比较倾向观察或者阅读某些重要的局部信息,并把不同区域的局部信息进行整合起来,从而快速建立起对被观察事物或者被阅读文章的整体概览。所以attention注意力机制就是对待处理的图片、文本等数据的局部信息给与不同的权重,从而实现某种任务。所以attention是一种数据处理方法,可以理解为局部信息的权值。

Attention Mechanism最早被应用于图像领域,该思想于一九九几年被提出。

Attention机制最先被应用在NLP任务中,主要是为了优化改进局部信息对预测结果的重要性,从而使得encoder与decoder能够学习到更高的序列信息。

Google 2017年的一篇关于 attention机制的文章:

Attention is all you need   https://arxiv.org/pdf/1706.03762.pdf

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值