推荐系统与Attention机制——详解Attention机制

最新推荐文章于 2024-08-15 14:15:00 发布

置顶

caizd2009

最新推荐文章于 2024-08-15 14:15:00 发布

阅读量7.1k

点赞数 8

分类专栏：数据挖掘文章标签：推荐人工智能深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caizd2009/article/details/87919952

版权

本文介绍了Attention机制，起源于人类视觉注意力，用于模型捕捉重要信息。它在自然语言处理、计算机视觉和推荐系统等领域有广泛应用。推荐系统中，如DIN模型，通过Attention机制捕捉用户在不同场景下的多峰兴趣，提高推荐精准度。

摘要由CSDN通过智能技术生成

什么是Attention机制？

Attention机制的本质来自于人类视觉注意力机制。人们在看东西的时候一般不会从到头看到尾全部都看，往往只会根据需求观察注意特定的一部分。

简单来说，就是一种权重参数的分配机制，目标是协助模型捕捉重要信息。具体一点就是，给定一组<key,value>，以及一个目标（查询）向量query，attention机制就是通过计算query与每一组key的相似性，得到每个key的权重系数，再通过对value加权求和，得到最终attention数值。

优缺点：

优点：

一步到位获取全局与局部的联系，不会像RNN网络那样对长期依赖的捕捉会收到序列长度的限制。
每步的结果不依赖于上一步，可以做成并行的模式
相比CNN与RNN，参数少，模型复杂度低。(根据attention实现方式不同，复杂度不一）

缺点：

没法捕捉位置信息，即没法学习序列中的顺序关系。这点可以通过加入位置信息，如通过位置向量来改善，具体可以参考最近大火的BERT模型。

最低0.47元/天解锁文章

关注

8
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。