一、推荐系统概述
1.1 推荐系统的目的
解决如何从大量信息中找到自己感兴趣的信息。
让用户更快更好的获取到自己的内容
让内容更快更好的推送到喜欢它的用户手中
让(网站)更有效的保留用户资源
1.2 推荐系统基本思想
- 利用用户和物品的特征信息,给用户推荐哪些具有用户喜欢的特征的物品。
- 利用用户喜欢过的物品,给用户推荐与他喜欢过的物品相似的物品。
- 利用和用户相似的其他用户,给用户推荐哪些和他们兴趣爱好相似的其他用户喜欢的物品。
推荐系统数据分析
- 推荐物品或内容的元数据,例如关键字,分类标签,基因描述等;
- 系统用户的基本信息,例如性别,年龄,兴趣标签等;
- 用户的行为数据,可以转化为对物品或者信息的偏好,分为两类:
- 显式的用户反馈:用户对物品评分或者评论等。
- 隐式的用户反馈:使用网站,产生了数据,隐式的反映了用户对物品的喜好。
1.3 推荐系统分类
- 实时性分类
- 离线推荐
- 实时推荐
- 推荐是否个性化分类
- 基于统计的推荐
- 个性化推荐
- 推荐原则分类
- 基于相似度推荐
- 基于知识的推荐
- 基于模型的推荐
- 数据源分类
- 基于人口统计学的推荐
- 基于内容推荐(Content based CB)
- 主要利用用户评价过的物品内容特征
- 基于协同过滤推荐(CF)
- 基于近邻的协同过滤
- 基于用户(User-CF)
- 基于物品(Item-CF)
- 基于模型的协同过滤
- 奇异值分解(SVD)
- 潜在语义分析(LSA)
- 支撑向量机(SVM)
- 基于近邻的协同过滤
- 混合推荐
二、推荐系统评测
2.1 评测指标
- 预测准确度
- 信任度
- 用户满意度
- 实时性
- 覆盖率
- 健壮性
- 多样性
2.2 推荐准确度评测
-
评分预测
一般用均方根误差(RMSE)或**平均绝对误差(MAE)**计算
R M S E = ( ∑ u , i ∈ T ( r u i − r u i ^ ) 2 ∣ T ∣ ) RMSE = \sqrt{(\frac{\sum_{u,i \in T}(r_{ui} - \hat{r_{ui}})^2}{|T|})} RMSE=(∣T∣∑u,i∈T(rui−rui^)2)M S E = ∑ u , i ∈ T ∣ r u i − r u i ^ ∣ ∣ T ∣ MSE = \frac{\sum_{u,i \in T}|r_{ui} - \hat{r_{ui}}|}{|T|} MSE=∣T∣∑u,i∈T∣rui−rui^∣
-
Top-N推荐
网站提供推荐服务时,一般会给用户一个个性化的推荐列表,叫做TOP-N推荐。
预测准确率一般用精确率和召回率来度量。