推荐系统学习笔记

最新推荐文章于 2024-04-28 09:36:30 发布

三七、

最新推荐文章于 2024-04-28 09:36:30 发布

阅读量233

点赞数

分类专栏：推荐系统文章标签：机器学习人工智能推荐系统

本文链接：https://blog.csdn.net/geek_hch/article/details/121106263

版权

2 篇文章 0 订阅

订阅专栏

利用user-item交互矩阵（m x n维，一般用户数m远大于商品数n），生成user向量和item向量。

UserCF
- 通过当前用户topk相似用户对待预测商品的评分加权平均得到，具有社交性、适合热点追踪。
- 需要维护 $m^2$ 级别的用户相似度矩阵。
- 用户的购买历史数据大多稀疏，因此用户相似度计算不可靠。
ItemCF:
- 通过当前用户最喜爱topk的商品，搜索其他相似商品，生成推荐列表。具有明显的兴趣类别特征。

业务数据为交互矩阵 $D_{m\times n}$ 。注意消除打分偏差（用户给分偏好、评分体系均值等）

特征值分解：仅用于方阵，无法用于推荐
奇异值分解：要求原始矩阵稠密、计算复杂度高
梯度下降：目标函数为使user向量 $\boldsymbol p_u$ 和item向量 $\boldsymbol q_u$ 点积尽可能逼近对应的交互评分 $r_{ui}$
$min_{\boldsymbol{q,p}} \sum(r_{ui} - \boldsymbol q_i\cdot \boldsymbol p_u) + \lambda(||\boldsymbol q_i|| + ||\boldsymbol p_i||)^2$

步骤：
1. 将用户特征转换成数值向量
2. 确定优化目标（点击率、购买率）
3. 训练、预测排序
公式：
$f(\boldsymbol x)=\frac{1}{1+e^{-(\boldsymbol{w\cdot x} + b)}}$
$\argmax_{\boldsymbol w}(f(\boldsymbol x))^y(1-f(\boldsymbol x))^{1-y}$
缺点：无法进行自动特征交叉、筛选等操作。存在辛普森悖论。

POLY2
$POLY2(\pmb w, \pmb{x})=\sum^n_{j_1=1}\sum^n_{j_2=j_1+1}\pmb{w}_h(j_1,j_2)\pmb{x_1}\pmb{x_2}$
FM
FFM

通过聚类分片，在不同分段类使用LR, 实现整体上的非线性

关注