传统协同过滤
传统的协同过滤是基于用户与物品的相似度进行推荐,即UserCF与ItemCF。后续的改进思路则是基于CF的问题进行改进。主要问题有:
- 准确率的不足
- 计算效率不足
- 共现矩阵过于稀疏,不利于算法计算
- 头部效应和长尾(冷门)物品
- …
相似性的算法改进
最简单明了的想法是直接改进相似度的计算方法,提高相似度,提高准确率。最常用的相似度计算方法有欧几里得距离、余弦相似度和皮尔逊相似度。
修正余弦相似度是一种传统的相似度度量方式,因其本身在计算用户相似度时考虑到评分尺度这一因素,能够避免评分习惯造成的评分偏差,使得度量相似度更加合理:
或者给热门项目加入惩罚因子:
提出用户间共同评价商品个数以及商品的热门程度这两个相似度影响因素并对传统的皮尔逊相似度公式进行改进:
参考文献:
针对修正余弦相似度改进的协同过滤推荐算法