1.推荐系统的基本思想
• 利用用户和物品的特征信息,给用户推荐那些具有用户喜欢的特征的物品。
• 利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品。
• 利用和用户相似的其他用户,给用户推荐那些和他们兴趣爱好相似的其他用 户喜欢的物品。
2.推荐系统的数据分析
3.推荐系统的分类
• 根据实时性分类
– 离线推荐
– 实时推荐
• 根据推荐原则分类
– 基于相似度的推荐
– 基于知识的推荐
– 基于模型的推荐
• 根据推荐是否个性化分类
– 基于统计的推荐
– 个性化推荐
• 根据数据源分类
– 基于人口统计学的推荐(利用用户的基本信息)
– 基于内容的推荐
– 基于协同过滤(Collaborative Filtering,CF)的推荐(就是利用用户的一些行为,例如评分,晒单等等)
4.推荐系统的试验方法
• 离线实验(训练的一个过程)
– 通过体制系统获得用户行为数据,并按照一定格式生成一个标准的数据集
– 将数据集按照一定的规则分成训练集和测试集
– 在训练集上训练用户兴趣模型,在测试集上进行预测
– 通过事先定义的离线指标评测算法在测试集上的预测结果
• 用户调查
– 用户调查需要有一些真实用户,让他们在需要测试的推荐系统上完成一些任务;我们需要记录
他们的行为,并让他们回答一些问题;最后进行分析
• 在线实验
– AB测试(对于实验的结果得出,我们使用不同的方式,就是换条路走,确定一个 好的模型)
5. 推荐系统评测指标
• 预测准确度
• 用户满意度 • 覆盖率
• 多样性
• 惊喜度
• 信任度
• 实时性
• 健壮性
• 商业目标
6.推荐准确度测评
评分预测
– 很多网站都有让用户给物品打分的功能,如果知道用户对物品的历史评分,就可
以从中学习一个兴趣模型,从而预测用户对新物品的评分
– 评分预测的准确度一般用均方根误差(RMSE)或平均绝对误差(MAE)计算
Top-N推荐
– 网站提供推荐服务时,一般是给用户一个个性化的推荐列表,这种推荐叫做
Top-N推荐
– Top-N推荐的预测准确率一般用精确率(precision)和召回率(recall)来度量
7.准确率、精确率、召回率
准确率、精确率和召回率