一种超级简单的Self-Attention ——keras 实战

最新推荐文章于 2025-03-24 20:46:31 发布

飞翔的大马哈鱼

最新推荐文章于 2025-03-24 20:46:31 发布

阅读量2.6k

点赞数 2

分类专栏：机器学习理论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lyb3b3b/article/details/106137991

版权

作者：王同学死磕技术
链接：https://www.jianshu.com/p/0f0c674837e3
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

Attention技术在 NLP 模型中几乎已经成了不可或缺的重要组成部分，最早Attention主要应用在机器翻译中起到了文本对齐的作用，比如下图，Attention 矩阵会将法语的 La Syrie 和英语的 Syrie 对齐，Attention 机制极大的提升了机器翻译模型的性能。

而最近各种花式的Attention机制相继被提出，同时这些Attention机制也不断的刷新着各种NLP任务的SOTA（state of the art）。Attention 机制一般用于RNN，其主要思想是引入一个外部的权重得分值，对RNN每个时刻Cell的输出做一个重要度打分。由于RNN本质上还是一个特征抽取的过程，所以Attention机制的目标是帮助我们自动找出RNN的哪个时刻Cell的输出是强特，如果是RNN的输入是一个句子，我们就希望Attention机制能够帮我们找出，句子中的哪个词是比较关键的词。通俗的说法就是Attention机制使模型在做任务时，将注意

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。