推荐系统做什么?
从用户和用户 的显性/隐形行为中 找到隐藏的连接
从而找到用户和物品直接的连接
分类
评分预测
预测用户会打高分的物品
- 原理:评分机制,尽量减小预测分数 与 实际分数的误差【回归问题】
-(均方根误差)
-() - 优点:计算简单,原理易理解
- 缺点:显性反馈收集信息
-数据收集不易
-数据质量难以保证,用户主观性影响很大
-分布不稳定,因用户个体和时期 结果会有差异性
行为预测
预测用户某个行为的发生概率&对物品进行相对排序
-
原理:
-类似于二分类的问题(对一种行为)
-多个行为多个物品(见后面原理篇) -
优点:
-数据收集更容易、更能体现用户内心真实想法
-隐性反馈的数据更容易和 预测目标函数【通过 特征 得到 预测值 的函数】 有关系(有时候人类不能理解的数据,对机器而言可能是联系关键) -
缺点:
-过程不容易被人理解
-数据特征选择 对预测结果 影响大 -
举例:
-预测用户 “喜欢 or 不喜欢” 物品A
-预测用户对展示的物品A “点击 or 不点击”(CTR)
常用算法演变史
内容推荐
用户画像
维度+量化
- 本身属性
- 标签化:将行为数据转化为标签化
- 完全向量化数据:给机器看,机器通过学习从而得到用户向量
近邻推荐
- 协同过滤
-
基于用户的协同
-
基于物品的协同
矩阵分解
-
矩阵分解
-
最小二乘法
-
贝叶斯(排序)
模型融合
MAB
深度学习
其他
常见问题
- 冷启动
- 探索与利用
- 安全