[论文笔记]amazon: item-to-item collaborative filtering

最新推荐文章于 2020-04-29 20:30:00 发布

inte_sleeper

最新推荐文章于 2020-04-29 20:30:00 发布

阅读量2.3k

点赞数

分类专栏：数据挖掘文章标签：算法扩展

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/inte_sleeper/article/details/7448647

版权

数据挖掘专栏收录该内容

15 篇文章 0 订阅

订阅专栏

作者为amazon的Greg Linden, Brent Smith, and Jeremy York。

内容概要：

1. 传统的user-based协同过滤算法，复杂度为O(MN)，其中M为用户数量，N为商品数量。由于大部分的用户购买都很稀疏，只有极少数用户可能购买了大量商品，因此复杂度可以简化至O(M+N)。然而这个算法受用户数和商品数影响较大，在大多数大型系统中较难应用。

2. 基于聚类的推荐。首先使用聚类算法将用户分群，然后为用户推荐本群内其他用户购买的商品。聚类可以离线计算，因而具有较好的可扩展性，但是推荐质量受聚类的精确度影响较大。如果聚类不太准确，则推荐质量下降较大。

3. 基于搜索的推荐。这个主要就是content-based的方法。通过标题、商品描述等属性计算相似度，然而content-based有可能会造成相似的过度拟合（比如标题一模一样的两本书），而且受场景限制较大，因而并不是很实用。

4. item-to-item的协同过滤算法。这个算法预先计算宝贝的相似度（跟计算用户相似度类似，只是向量由原来的用户之间的共同购买/评分宝贝变成宝贝之间的共同购买/评分用户）。由于该算法需要遍历任意两个宝贝对，以及这两个宝贝对的所有购买用户，因而复杂度为O(N^2*M)。同样由于大部分用户购买都较少，复杂度可以简化至O(MN)。该算法可以离线计算，并且更新较少，因此较为实用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。