基于物品的协同过滤算法：理论说明，代码实现及应用

基于物品的协同过滤算法详解与实现

最新推荐文章于 2025-09-29 17:45:28 发布

原创

最新推荐文章于 2025-09-29 17:45:28 发布 · 3.4w 阅读

132 ·

CC 4.0 BY-SA版权

文章标签：

#协同过滤算法 #python

本文详细介绍了基于物品的协同过滤算法，包括理论基础、算法实现和实际应用。通过计算物品相似度和用户历史行为，生成推荐列表。算法关键步骤包括建立用户物品倒排表、计算共现矩阵和余弦相似度矩阵。讨论了UserCF与ItemCF的适用场景，并提供了实际案例和源代码链接。

基于物品的协同过滤算法：理论说明，代码实现及应用

标签：爬虫 Python

主要参考资料：
项亮. 推荐系统实践[M]. 北京:人民邮电出版社, 2012.

转载请注明出处：http://blog.csdn.net/xuelabizp/article/details/51823458

0.一些碎碎念

从4月中旬开始，被导师赶到北京的郊区搬砖去了，根本就没有时间学习看书，这个时候才知道之前的生活是多么的幸福：每天看自己想看的书，然后实践一下，最后写博文总结一下，偶尔还能去跑个步，游个泳。想找实习的计划也泡汤了，这个项目最早要到七月中下旬才能结束，只能自己挤时间学习了。

逝者如斯夫，不舍昼夜。

1.基于物品的协同过滤算法简介

如今网上信息泛滥，想要在里面找一条适合自己的信息的成本真的有点高，所以就有了推荐系统。于用户而言，推荐系统能够节省自己的时间；于商家而言，推荐系统能够更好的卖出自己的商品。

基于邻域的推荐算法是推荐系统中最基本的算法，该算法分为两大类：基于用户的协同过滤算法(UserCF)和基于物品的协同过滤算法(ItemCF)。

基于用户的协同过滤算法就是找到和“目标用户”相似的用户，然后把他喜欢的东西推荐给“目标用户”。例如小王和小赵一对好基友，他俩喜欢看的书风格基本相同。如果有一天，系统发现小赵给自己的书架添加了一本新书，并且评价很高，那么系统就把这本书自动推荐给了小王，因为小王喜欢这本书的概率很大。设 $N (u)$ 表示用户 $u$ 喜欢的物品， $N (v)$ 表示用户 $v$ 喜欢的物品，则两个用户的相似度为：
$w=\frac {\mid N(u)\bigcap N(v)\mid}{\mid N(u)\bigcup N(v)\mid} \tag 1$