注意力机制是什么？解决什么问题?

最新推荐文章于 2024-03-29 16:39:11 发布

逍遥壮士

最新推荐文章于 2024-03-29 16:39:11 发布

阅读量364

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_16498553/article/details/134522325

版权

介绍

人工智能的注意力机制是受到人类大脑中注意力分配方式的启发而提出的一种模型结构，旨在使机器学习系统能够像人类一样，在处理信息时根据重要性分配不同的注意力。注意力机制的核心思想是，在信息处理过程中，不同部分的输入数据可以有不同的权重，从而可以更加有效地处理复杂的输入信息。

个人理解：比如你正在看这个文章，那么你首先看到的是标题，然后是内容，其他你非关注点之外的都会被忽略，比如这里别人发消息给你。

注意力机制的主要作用包括：

提高模型对输入信息的理解能力：通过关注输入数据中的关键部分，注意力机制可以帮助模型更好地理解输入的含义，从而提高了模型的性能。
解决长距离依赖问题：在传统的神经网络结构中，当输入序列较长时，信息在不同层之间的传递会变得困难。注意力机制可以帮助模型更好地捕捉远距离的依赖关系，从而提高了模型在处理长序列数据时的效果。
实现可解释性：通过注意力权重，可以清晰地看到模型在处理数据时所关注的重要部分，这样可以增加模型的可解释性，帮助用户理解模型的决策过程。

注意力机制通过为每个输入部分分配不同的权重，使得模型在处理输入信息时能够更加灵活、高效地分配注意力，从而提高了模型的表达能力和泛化能力。这一机制在自然语言处理、计算机视觉等领域得到了广泛应用，并取得了显著的成果。

最后

注意力机制来源于人类的视觉处理系统，比如当我们正在看此篇文章时候，那么你更多关注你正在看的内容，其它都被忽略了。像Transformer、LSTM、RNN、CNN、GRU等框架都广泛应用。

参考文章：

https://zhuanlan.zhihu.com/p/53036028

https://lulaoshi.info/deep-learning/attention/attention.html#attention%E6%9C%BA%E5%88%B6

https://www.cnblogs.com/luv-gem/p/10712256.html

https://transformers.run/back/attention/

https://zhuanlan.zhihu.com/p/618938678?utm_id=0

https://baike.baidu.com/item/%E6%B3%A8%E6%84%8F%E5%8A%9B%E6%9C%BA%E5%88%B6/22768534?fr=ge_ala

相关视频：

https://www.bilibili.com/video/BV1Go4y1V7SD/?spm_id_from=trigger_reload&vd_source=7d0e42b081e08cb3cefaea55cc1fa8b7

相关论文：

https://arxiv.org/pdf/1802.05751.pdf

https://arxiv.org/pdf/1706.03762.pdf

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
注意力机制是什么？解决什么问题?

介绍人工智能的注意力机制是受到人类大脑中注意力分配方式的启发而提出的一种模型结构，旨在使机器学习系统能够像人类一样，在处理信息时根据重要性分配不同的注意力。注意力机制的核心思想是，在信息处理过程中，不同部分的输入数据可以有不同的权重，从而可以更加有效地处理复杂的输入信息。个人理解：比如你正在看这个文章，那么你首先看到的是标题，然后是内容，其他你非关注点之外的都会被忽略，比如这里别人发消息给你。注意...
复制链接

扫一扫

博客等级

码龄10年

225
原创

165
点赞

599
收藏

235
粉丝

关注

私信

热门文章

分类专栏

spring 33篇
源码学习 12篇
概念 23篇
虚拟机(JVM) 20篇
算法 2篇
mysql 1篇
问题解决 9篇
kafka
maven 9篇
spring配置 21篇
高新技术 1篇
rabbitmq 1篇
集成 17篇
设计模式 33篇
工具 2篇
版本控制 1篇
linux 3篇

最新评论

windows10搭建llama大模型
逍遥壮士: https://mp.weixin.qq.com/s?__biz=MzI3MTA1ODkzNg==&mid=2247489091&idx=1&sn=4b014fec225a63daa733786de3cd5836&chksm=eac6c4d4ddb14dc2d70f6657525b8b5ccd6cd7259297d376422103c7aba66eb4fd0eb7f87f46&token=269084170&lang=zh_CN#rd
windows10搭建llama大模型
dongfengxueli: 转中文的那个python文件在哪
google开源大模型-gemini
逍遥壮士: 作为一名开发及学习者，要有对照和参照。否则怎么知道哪个会更好，哪个更适合，根据模型的特点及能力来选择，并不是说chatgp4就适合自已业务场景。像我在用的时候更多的考虑的是合法、业务需要什么样的场景，有可能，我都不需要大模型tf2或pytorch就搞定了。
google开源大模型-gemini
牧羊者的故事: 试了文档理解遥遥领先，别拿国内的说事了，都不是一个数量级的
windows10搭建llama大模型
逍遥壮士: 不好意思，最近没看回复，请参考下原文有。 https://mp.weixin.qq.com/s?__biz=MzI3MTA1ODkzNg==&mid=2247489091&idx=1&sn=4b014fec225a63daa733786de3cd5836&chksm=eac6c4d4ddb14dc2d70f6657525b8b5ccd6cd7259297d376422103c7aba66eb4fd0eb7f87f46&token=269084170&lang=zh_CN#rd

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。