文章目录
一. 推荐系统概述
1. 推荐系统目的
- 让用户更快更好的获取自己感兴趣的信息
- 让信息更快更好的推送到喜欢它的用户手中
- 让平台更有效的保留用户资源
2. 推荐系统的应用
- 电子商务
- 电影视频
- 个性化音乐
- 个性化阅读
- 社交网络
- 个性化广告
3. 推荐系统的基本思想
- 【知你所想,精准推荐】利用用户和物体的特征信息,给用户推荐那些具有用户喜欢的特征的物品
- 【人以群分】利用和用户相似的其他用户,给用户推荐和他兴趣爱好相似的用户喜欢的物品(二人一物)
- 【物以类聚】利用用户喜欢过的物品,给用户推荐和这些物品类别相同或者说相似的物品(一人二物)
数据分析(数据源)
用户:个人信息,喜好标签,上下文信息
物品:内容信息,分类标签,关键词
行为数据:点击,浏览,收藏,购买,评分/评论,打标签
4. 推荐系统的分类
- 基于实时性分类:离线推荐,实时推荐
- 基于推荐是否个性化分类:基于统计,基于个性化
- 基于推荐原则分类:基于相似度【人以…,物以…】,基于知识【定好规则】,基于模型【机器学习发现规律】
- 基于数据源分类:基于人口统计学,基于内容,基于协同过滤
二. 推荐系统算法简介
1. 基于人口统计学的推荐算法
【个人信息相似,根据喜好标签进行推荐,适用于刚注册平台的新用户】
2. 基于内容的推荐算法
【物品标签类似,类似物品交叉推送给浏览过此类物品的人】
【伪数据表设计】
物品id | … | 类别 | 浏览过的用户 |
---|---|---|---|
1 | … | A类 | u1 |
2 | … | A类 | u2 |
3 | … | B类 |
因为u1浏览过A类物品1,则可以把A类其他物品(如2)推荐个u1
因为u2浏览过A类物品2,则可以把A类其他物品(如1)推荐给u2,
3. 基于协同过滤(行为数据)
前提:得有历史数据
- 基于近邻的协同过滤
-
基于用户
-
基于物品
- 基于模型的协同过滤
- 奇异值分解(SVD)
- 潜在语义分析(LSA)
- 支撑向量机(SVM)
4. 混合推荐
- 加权混合:将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的结果
- 切换混合:切换的混合方式,就是允许在不同情况(数据量,系统运行状况,用户和物品的数目等)下,选择最为合适的推荐机制计算推荐
- 分区混合:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户
- 分层混合:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐