一、基本思想
BaseLineOnly算法被称为基准预测。其是建立在一定的假设上:
- 每个用户的评分基准都是不同的,比如有的用户喜欢给高分,就算对于不喜欢的物品他也会给出6分的及格分(10分满分),而有的用户比较苛刻,对于很喜欢的物品也只给出7分,而不喜欢的物品直接给出2分。
- 每个物品的好坏也是不同的,有些物品很受欢迎,可能大部分人都给出7分左右,而有的物品很差,每次都得到3分左右。
我们的算法就利用了这种偏差,我们称这种偏差为偏置(bias)
二、求解目标
我们假设整体的平均评分为 μ \mu μ,用户 u u u的评分偏置为 b u b_u bu,物品 i i i的评分偏置为 b i b_i bi,那么我们的目标就是:
- 找出每个用户普遍高于或低于其他人的评分偏置 b u b_u bu
- 找出每个物品普遍高于或低于其他物品的评分偏执 b i b_i bi
用户 u u u对物品 i i i的预测评分为: p u i = μ + b u + b i p_{ui}=\mu+b_u+b_i