1.推荐系统的分类
- 根据实时性分类
- 离线推荐
- 实时推荐
- 根据推荐是否个性化分类
- 基于统计的推荐
- 个性化推荐
- 根据推荐原则分类
- 基于相似度的推荐
- 基于知识的推荐
- 基于模型的推荐
- 基于数据源分类
- 基于人口统计学的推荐
- 基于内容的推荐
- 基于协同过滤的推荐
2.推荐算法介绍
2.1基于人口统计学的推荐算法
2.2基于内容的推荐算法
2.3基于协同过滤的推荐算法 ***
C o l l a b o r a t i v e F i l t e r i n g Collaborative Filtering CollaborativeFiltering
- 基于近邻的协同过滤
- 基于用户
- 基于物品
- 基于模型的协同过滤
- 奇异值分解(SVD)
- 潜在语义分析(LSA)
- 支持向量机(SVM)
3.推荐系统实验方法
- 离线实验
- 通过体制系统获得用户行为数据,并按照一定格式生成一个标准的数据集
- 将数据集按照一定的规则分为训练集和测试集
- 在训练集上训练用户兴趣模型,在测试集上进行预测
- 通过事先定义的离线指标评测算法在测试集上的预测结果
- 用户调查
- 用户调查需要一些真实用户,让他们在需要测试的推荐系统上完成一些任务,我们需要记录他们的行为,让他们回答问题,最后分析
- 在线实验
- AB测试(需要长周期)
4.推荐系统评测指标
-
预测准确度
-
评分预测
-
很多网站都有让用户给物品打分的功能,如果知道用户对物品的历史评分,就可以从中学习一个兴趣模型,从而预测用户对新物品的评分
-
评分预测的准确度一般用均方根误差(RMSE)或平均绝对误差(MAE)计算
-
-
Top-N推荐
- 网站提供服务的时候,一般是给用户一个个性化的推荐列表,这种推荐叫做Top-N推荐
- Top-N推荐的预测准确率一般用精确率和召回率来度量
-
-
用户满意度
-
覆盖率
-
多样性
-
惊喜度
-
信任度
-
实时性
-
健壮性
-
商业目标
#回顾一下准确率,精确率和召回率的概念