基于项目的协同过滤

最新推荐文章于 2024-07-02 18:52:51 发布

森总工作室

最新推荐文章于 2024-07-02 18:52:51 发布

阅读量3.6k

点赞数

分类专栏：推荐技术&&广告技术文章标签：推荐技术

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zengxiaosen/article/details/56353906

版权

推荐技术&&广告技术专栏收录该内容

49 篇文章 4 订阅

订阅专栏

基于物品的协同过滤更受欢迎

历史原因：基于邻居的协同过滤是早期推荐系统的主流。

现实原因：比如亚马逊的电商系统，用户数是指数增长的，而物品（图书）数量是线性增长的。所以说item是相对稳定的。而用户数是不稳定的。

这样，我们就能很好的计算项目之间的相似度，不用频繁的计算用户之间的相似度。

所以用户的增长对我们项目的影响不是很大，因为我们的项目还是由用户进行表示的。我们新来的用户并不需要急着加入到项目之间的相似度计算中，因为由历史数据就可以知道项目之间的相似度，并且对新来的用户还是比较适用的。

用户数一般都是大于项目数了，所以很明显，我们应该以项目数来所谓相似度矩阵的计算。

用户偏好数据：

显示反馈：点击，评分，收藏等，但很多用户是不评分的，矩阵特别稀疏，所以计算是非常不准确的。这时候可以用到隐示反馈

隐示反馈：从用户评论当中去挖掘用户的偏好。

把这些信息都参与进评分权重中。

user1 user2 user3...

item1

item2

item3

在这个item矩阵中，是有很多缺失值的，那么怎么去对待这些缺失值。

比如我们对于item1来说，我们想知道user1给他的打分，我们发现user1给item1的相似item,item2评分是5，在实际应用中，要计算item1和所有用户偏好item的相似度，把这个相似度乘以用户对偏好item的评分，做一个累加，来作为对item1的评分，那么我们很有可能就把5填充到user1对item1的打分。

那么所有推荐的集合里面我们都用这种方式，我们就能得到对于user1的topN，再除去已有打分，那么就可以推荐了。

森总工作室

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
基于项目的协同过滤

基于物品的协同过滤更受欢迎历史原因：基于邻居的协同过滤是早期推荐系统的主流。现实原因：比如亚马逊的电商系统，用户数是指数增长的，而物品（图书）数量是线性增长的。所以说item是相对稳定的。而用户数是不稳定的。这样，我们就能很好的计算项目之间的相似度，不用频繁的计算用户之间的相似度。所以用户的增长对我们项目的影响不是很大，因为我们的项目还是由用户进行表示的。我们新来的用户并不需要急着
复制链接

扫一扫

专栏目录

森总工作室 CSDN认证博客专家 CSDN认证企业博客

码龄8年

152: 原创

13万+: 周排名

225万+: 总排名

101万+: 访问

: 等级

1万+: 积分

198: 粉丝

147: 获赞

64: 评论

433: 收藏

私信

关注

热门文章

分类专栏

最新评论

c++中指向函数的指针
m0_74240464: 返回值是int*
odl安装的一些坑
啧啧啧可怕: 这个switch是前端ui界面嘛这个我装不上诶
可重复读
ty1314yy: 想问一下，当隔离级别是RR时，事务A执行了select，按照您内容上写的事务B的insert、update、delete操作都执行不了，那什么情况下会出现幻读呢，RR级别不应该是仅仅对应update操作吗。
dpdk多队列机制
guanyuni363: 设备使用dpdk绑定了两张网卡（各八个队列）但是使用rte_eth_dev_configure()配置网卡的时候只检测到八个可用队列，怀疑第二张网卡的队列数根本没有检测到，请问一下怎么样能让使用第二张网卡的队列，有什么解决的办法吗？
mr中的combiner
weixin_43211484: “这行代码是哪行啊？？？”

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。