在推荐系统中,该算法出现最早。在2000年之前,都十分著名。
基本思想
假若用户喜欢物品A,并且物品A和物品B具有很大的相似度,那么该用户大都也喜欢物品B。
步骤:
-
倒排法-为了避免计算显然不相关的两个用户相似度,减少计算开支;
-
计算商品之间相似性;
-
找到用户喜欢的商品集合,计算与目标用户没有购买的商品之间的相似性,取前几个商品推荐给目标用户。
倒排法
首先利用将用户–物品表(倒排表);
根据倒排表画出相似度矩阵(比如倒排表第一行说明ab ad bd有关联,就在矩阵中置1,第三行说明ab有关联,又加1变为了2)
矩阵中为0的我们就不需要去计算它们的兴趣相似度了。
得到商品相似度之后,我们开始计算商品之间相似度。