概述
在推荐系统中,协同过滤(CF:Collaborative Filtering)算法由于其领域无关性以及比较好的推荐效果被广泛使用;
CF模型比较常用的包括最近邻方法和因子分解算法,由于这两种算法各有优缺点;该文提出了一种策略将这两种方法进行综合建模,并且可以适用于隐式反馈数据。
已有模型
最近邻方法
CF常用的有user_based和item_based两个模型,后者由于其推荐效果和可解释性比较强,比较被推荐使用。
item_based方法思路是根据用户个人偏好推荐和这些item最相关的物品。过程如下
1. 根据用户和物品的打分矩阵或者相关数据,计算物品两两之间的相似度 s(i,j) ,常用相似度算法包括皮尔逊系数、jaccard系数
2. 通常情况下相似度计算可能需要大量数据支持,对于稀疏数据需要对数据规模进行置信度加权,常用加权方法可以是 sij=nijnij+λpij
3. 用户对某物品打分公式为 rui=bui+∑j∈Ski;usij(ruj−buj)∑j∈Ski;usij ,其中 bui为基准推荐模型,计算公式为bui=μ+bu+bi,即全局偏置+用户偏置+物品