推荐系统实践
1 好的推荐系统
1.1 基本任务:联系用户和物品
与分类目录、搜索引擎一样解决信息过载问题。
解决无明确目的的物品需求,并能发掘物品长尾。
1.2 推荐应用
应用于电子商务、视频网站、音乐电台、社交网络、个性化阅读、LBS、个性化邮件、定向广告投放。
前端页面、后台日志和推荐算法三功能。
1.3 系统评测
1)实验方法:离线实验、用户调查、在线实验。
2)评测指标:
用户满意度(问卷)。
预测准确度(评分预测RMSE和MAE、TopN推荐准确率和召回率)。
覆盖率(信息熵和基尼系数)。
多样性、新颖性、惊喜度、信任度、实时性、健壮性、商业目标。
3)评测维度:用户、物品、时间。
2 利用用户行为数据
2.1用户行为数据:正、负反馈
无上下文信息的隐性反馈数据
无上下文信息的显性反馈数据
有上下文信息的隐性反馈数据
有上下文信息的显性反馈数据
2.2 用户行为分析
1)用户活跃度和物品流行度的分布:长尾分布
2)用户活跃度和物品流行度的关系:协同过滤推荐算法
基于领域的方法:UserCF和ItemCF
隐语义模型LFM
基于图的随机游走算法
2.3 算法及评测
训练集和测试集、召回率、准确率、覆盖率、流行度
UserCF:用户相似度矩阵和用户对物品的兴趣度
ItemCF:物品相似度矩阵和用户对物品的兴趣度
LFM:P、Q矩阵SVD求解以及用户对物品的兴趣度
基于图的模型(graph-based model):度量顶点间相关性的算法,基于随机游走的PersonalRank算法
3 推荐系统冷启动问题
3.1 冷启动问题
1)用户冷启动:解决新用户个性化推荐
2)物品冷启动:解决新物品推荐给感兴趣用户
3)系统冷启动:解决新系统向用户推荐物品
4)非个性化推荐:热门排行榜