推荐系统项目基础(三)基于模型的协同过滤
基于图的协同过滤算法
基于相邻域的模型可以看做基于图的模型的简单形式
- 将用户行为数据表示为二分图
- 基于二分图为用户进行推荐
- 根据两个顶点之间的路径树、路径长度和经过的顶点数来评价两个顶点的相关性。
基于回归模型的协同过滤算法
如果将评分看做时一个连续的值而不是离散的值,那么就可以借助线性回归的思想来预测目标用户对某物品的评分。其中一种实现策略被称为Baseline(基准预测)。Baseline的协同过滤算法思想可以概括如下:
- 这个算法是根据数据用来训练一个模型,而不是直接输出某个值
- 模型的思想是借助了回归的思想,相当于通过数据,回归得出了每个电影的偏差值与每个用户的偏差值,与所有的平均分进行相加则得到了用户的预测值。
baseline基准用户
baseline基于以下的预测
- 有些用户的评分普遍高于其他用户,有些用户的评分普遍低于其他用户。比如有些用户比较苛刻,有些用户比较宽容
- 一些物品的评分高于其他物品,有些物品的评分低于其他物品。
baseline目标
- 找出每个用户普遍高于他人的偏差值 b u b_u bu
- 找过每个物品普遍高于或者低于其他物品的偏差值 b i b_i b