基于显示反馈(explicit feedback)的推荐
问题描述
假设我们将用户的显示反馈记录在一个矩阵(评分矩阵)中:
矩阵中的数字代表用户对物品的评分,?表示缺失值。这是一个预测评分的问题,我们需要通过群体智慧来预测?中的值
集体智慧假设
- User-based CF:
在过去有相同品味的用户们在未来也很有可能具有相似的品味。
- Item-based CF:
一个用户很有可能喜欢与他过去喜欢的物品相似的物品
符号定义
相似度
皮尔森相关系数----Pearson correlation coefficient (PCC)
user_u和user_w之间的相似度:
调整后的余弦相似度----Adjusted Cosine similarity
item_k和item_j 之间的相似度:
两种相似度的取值范围都是[-1,1]。-1为负相关,1为正相关。
邻居选择过程
- User-based CF
最近的Top-K 邻居:
- Item-based CF
最近的Top-K 邻居:
- 可能存在的问题
对于user和item来说,可能邻居不够K个(以user_u为例,就是买过自己买过的物品的其他user数量不足K个),这时候将会用到整个邻居集,这种情况下,靠邻居的信息来计算并没有那么可靠。
预测评分公式 (Prediction Rule)
User-based CF
user_u对item_ j的预测评分为:
Item-based CF
user_u对item_ j的预测评分为:
在预测公式中,所有的数值都是预计算好的,没有需要学习的参数。
其他的一些细节想到再补充。
本文内容来自SZU 潘老师的课件。