协同过滤
应用场景
UserCF:基于用户的协同过滤
适用于兴趣点不确定、分散的场景
有很强大的社交属性,可以快速将身边的人看过的东西推荐给用户,即便这个用户之前并没有太多的关注该点,但是还是可以获取到。
非常适用于新闻等热门事情。因为热门新闻大都没有单一兴趣点,内容较为广泛。
而UserCF可以快速发现、追踪热点。
ItemCF:基于物品的协同过滤
适用于兴趣点稳定的场景
比如用户在购买物品、观看电影等,他们的兴趣在一段时间内是固定的,便可以为用户推荐该Item的相似Item,在有限的时间内把握用户兴趣点,并为之提供相似服务。
未来CF的发展
A | 0 | 0 | 0 | 1 | 1 |
---|---|---|---|---|---|
B | 0 | 1 | 0 | 0 | 0 |
C | 0 | 0 | 1 | 0 | 0 |
D | 1 | 1 | 1 | 1 | 1 |
1、存在头部效应
上图为4个Item的向量,可以大概看到,其实A和B和C之间的相似度并不是很高,而这三个物品都D的相似度都很高,因为D是热门物品,导致该物品和其他的物品有很强的匹配度,这样一来会导致热门物品不论是否真正相似,也会被推荐的更多。基本每个物品的相似物品都有D在内。这肯定是不合理的。
2、存在尾部失踪
单从A、B、C三个物品来看,其实相似度并不高,这是因为该向量是稀疏的,已知信息太少而得不到足够准确的推荐,协同过滤天然对稀疏矩阵无力,单靠用户-物品信息推断出物品的相似结果是远远不够的。