协同过滤易错点
1. 基于用户的协同过滤
(1) 找到和目标用户兴趣相似的用户集合。
这里的相似指的是行为相似度,用户行为有:点赞、购买物品记录、
(2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
2. 基于物品的协同过滤
计算的是行为相似度,而不是物品内容属性的相似度,计算物品之间的相似度没有用到物品的内容属性,而是通过分析用户的,这一点容易理解偏差,需要明白一点,两个物品的内容属性(颜色、材料、外观)很相似并不是基于物品推荐算法的本质,或者我们可以认为,基于物品的推荐算法的相似度计算采用的是用户购买物品的统计数据之间的共性,也即行为相似度。购买物品A的用户大多购买了物品B,则认为物品A和B具有较大的相似性,如啤酒和尿布的关联性就比较强,这是典型的根据统计数据分析得出的结论。