【协同过滤进化】矩阵分解算法

淅淅沥沥的小太阳

于 2024-05-05 16:48:18 发布

阅读量650

点赞数 4

分类专栏：推荐系统文章标签：算法矩阵人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53259482/article/details/138468584

版权

推荐系统专栏收录该内容

14 篇文章 0 订阅

订阅专栏

一、发展动机

为解决UserCF和ItemCF协同过滤算法中头部效应明显，处理稀疏向量能力弱的问题，同时增加模型的泛化能⼒，矩阵分解技术被提出。

二、矩阵分解算法

该⽅法在协同过滤共现矩阵的基础上，使⽤更稠密的隐向量表⽰⽤户和物品，挖掘⽤户和物品的隐含兴趣和隐含特征，在⼀定程度上弥补了协同过滤模型处理稀疏矩阵能⼒不⾜的问题。

2.1、主要原理

矩阵分解算法则期望为每⼀个⽤户和视频⽣成⼀个隐向量，将⽤户和视频定位到隐向量的表⽰空间上，距离相近的⽤户和视频表明兴趣特点接近，在推荐过程中，就应该把距离相近的视频推荐给⽬标⽤户。

2.2、如何得到隐向量

在“矩阵分解”的算法框架下，⽤户和物品的隐向量是通过分解协同过滤⽣成的共现矩阵得到的，这也是“矩阵分解”名字的由来。

矩阵分解算法将m×n维的共现矩阵R分解为m×k维的⽤户矩阵U和k× n维的物品矩阵V相乘的形式。其中m是⽤户数量，n是物品数量，k是隐向量的维度。k 的⼤⼩决定了隐向量表达能⼒的强弱。k 的取值越⼩，隐向量包含的信息越少，模型的泛化程度越⾼；反之，k 的取值越⼤，隐向量的表达能⼒越强，但泛化程度相应降低。

此外，k 的取值还与矩阵分解的求解复杂度直接相关。在具体应⽤中，k的取值要经过多次试验找到⼀个推荐效果和⼯程开销的平衡点。

2.3、预估评分

基于⽤户矩阵 U和物品矩阵 V，⽤户 u对物品 i的预估评分：其中 pu是⽤户 u 在⽤户矩阵 U 中的对应⾏向量，qi是物品 i 在物品矩阵 V中的对应列向量。

三、矩阵分解算法评价

在矩阵分解算法中，由于隐向量的存在，使任意的⽤户和物品之间都可以得到预测分值。⽽隐向量的⽣成过程其实是对共现矩阵进⾏全局拟合的过程，因此隐向量其实是利⽤全局信息⽣成的，有更强的泛化能⼒；⽽对协同过滤来说，如果两个⽤户没有相同的历史⾏为，两个物品没有相同的⼈购买，那么这两个⽤户和两个物品的相似度都将为 0（因为协同过滤只能利⽤⽤户和物品⾃⼰的信息进⾏相似度计算，这就使协同过滤不具备泛化利⽤全局信息的能⼒）。

3.1、矩阵分解算法优点

泛化能⼒强。在⼀定程度上解决了数据稀疏问题。
空间复杂度低。不需再存储协同过滤模型服务阶段所需的“庞⼤”的⽤户相似性或物品相似性矩阵，只需存储⽤户和物品隐向量。空间复杂度由 n2级别降低到（n+m）·k级别。
更好的扩展性和灵活性。

3.2、矩阵分解算法缺点

与协同过滤⼀样，矩阵分解同样不⽅便加⼊⽤户、物品和上下⽂相关的特征，这使得矩阵分解丧失了利⽤很多有效信息的机会，同时在缺乏⽤户历史⾏为时，⽆法进⾏有效的推荐。

淅淅沥沥的小太阳

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【协同过滤进化】矩阵分解算法

为解决UserCF和ItemCF协同过滤算法中头部效应明显，处理稀疏向量能力弱的问题，同时增加模型的泛化能⼒，矩阵分解技术被提出。
复制链接

扫一扫

专栏目录

淅淅沥沥的小太阳 CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

127万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

412: 积分

195: 粉丝

198: 获赞

6: 评论

245: 收藏

私信

关注

热门文章

分类专栏

推荐系统 14篇

最新评论

使用Ananconda 创建环境时出现：UnavailableInvalidChannel: HTTP 404 NOT FOUND for channel simple
CSDN-Ada助手: 恭喜你能够持续不断地分享有关Anaconda的使用经验！对于你在创建环境时遇到的问题，我建议你可以尝试更新Anaconda的版本或者检查网络连接是否正常。另外，你也可以尝试使用其他渠道或者寻找相关的解决方案，相信你一定能够找到解决问题的办法。期待你的下一篇博客，继续分享关于Anaconda的使用心得和技巧！
【三维点云笔记】点云数据增强中随机dropping color的作用、流程、代码实现
CSDN-Ada助手: 恭喜用户在三维点云领域的博客创作取得了新进展！这篇关于点云数据增强中随机dropping color的内容非常有趣，对于我们理解点云处理的方法和技巧起到了很好的指导作用。希望用户在未来的创作中可以继续深入探讨其他数据增强技术的应用，比如点云旋转、缩放等，以及它们在实际场景中的效果评估。期待用户的更多精彩分享，加油！
「详解」torch.nn.Fold和torch.nn.Unfold操作
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题为「详解」torch.nn.Fold和torch.nn.Unfold操作。您的文章非常详细，我从中学到了很多关于torch.nn.Fold和torch.nn.Unfold操作的知识。感谢您的分享！在下一步的创作中，我建议您可以继续深入探索相关主题，比如探讨这些操作在不同实际应用中的具体用法和效果。同时，您可以考虑与其他相关操作进行对比，以帮助读者更好地理解它们的区别和优劣势。期待您继续分享更多精彩的博文！
【Error】无法解析导入“tensorflow.compat.v1”
CSDN-Ada助手: 恭喜您不断努力创作博客！关于您遇到的问题，或许您可以尝试检查一下您的环境设置是否正确，或者尝试使用其他方法来解决这个问题。期待您的下一篇博客，希望您能够继续分享您的经验和知识！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Tmux教程
CSDN-Ada助手: 这是一篇很有用的教程，对于初学者来说非常友好和易懂。希望作者可以继续分享更多关于Tmux的技巧和经验。除了session的管理，你还可以分享一些关于Tmux的插件和自定义配置，以及如何在Tmux中使用窗格和面板来提高工作效率。期待你的下一篇文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。