传统的协同过滤不考虑side information,把行为数据和side information结合使用,会提升推荐的准确率。
CF的缺点是前期通过阈值过滤了冷门商品,导致在热门商品中推来推去。
memory-based
用行为数据直接计算相似度
基于用户的协同过滤(User-based)算法
pass
基于物品的协同过滤(Item-based)算法
pass
基于模型的协同过滤(Model-based)算法
用行为数据先计算隐向量,用隐向量计算相似用户or物品
- 隐式语义分析(Latent Semantic Analysis, LSA)推荐算法:
原始矩阵为稀疏矩阵,通过ALS计算出的新矩阵则拥有原始矩阵缺失的值,即预测值 - Spark MLlib中 ALS是LFM算法的其中一种实现
- ALS是一种求解矩阵分解问题的最优化方法
混合CF
(同时考虑了User和Item两个方面),ALS算法也属于User-Item CF