推荐算法学习 —— 传统推荐算法

最新推荐文章于 2025-03-12 14:08:45 发布

学习推荐算法ing

最新推荐文章于 2025-03-12 14:08:45 发布

阅读量1.4k

点赞数

分类专栏：推荐算法文章标签：推荐系统算法机器学习深度学习人工智能

本文链接：https://blog.csdn.net/qq_37339433/article/details/112434401

版权

推荐算法专栏收录该内容

2 篇文章

订阅专栏

本文介绍推荐系统，它是互联网增长引擎，可解决用户信息过载问题。阐述其架构，包括数据和模型部分。还介绍传统推荐学习算法，如协同过滤算法族、逻辑回归模型族、因子分解机模型族及组合模型，分析各算法优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.推荐系统概览

1.1 推荐系统是互联网的增长引擎

互联网企业的核心需求是“增长”，而推荐系统正处在增长引擎的核心位置。
推荐系统要解决的用户痛点是用户如何在信息过载的情况下高效的获得感兴趣的信息。

1.2 推荐系统的架构

数据部分客户端及服务端实时数据处理 ——> 流处理平台准实时数据处理 ——> 大数据平台离线数据处理场景信息 - 物品信息 - 用户信息 ——> 特诊工程 ——> 用户特征 - 物品特征 - 场景特征
模型部分候选物品库 ——> 召回层 -》排序层 -》补充策略与算法层 ——> 物品推荐列表模型离线训练（离线测试） — 模型在线更新（线上A/B测试）

图片引用自 GitHub项目：https://github.com/wzhe06/SparrowRecSys

2.传统推荐学习算法

2.1 传统推荐模型的演化关系图

传统推荐模型的演化关系图

2.2.协同过滤算法族（CF - collaborative filtering）

1.协同过滤

1）相似性度量

余弦相似度
皮尔逊相关系数（减去均值的余弦相似度，减去用户均值、物品均值）

2）评分预测

userCF 适用于兴趣变化场景、社交性强的场景

相似度作为权重，加权其他用户对于该物品的评分

$R_{u,p} = \frac{\sum(w_{u,s})R_{s,p}}{\sum w_{u,s}}$

itemCF

适用于兴趣稳定场景

选取目标用户的正反馈物品寻找相似物品，基于相似度排序推荐

$R_{u,p} = \sum{(w_{p,h}R_{u,h})}$

3）缺点、限制（userCF）

用户数目大于物品数目
指数增长的相似度矩阵大小
用户历史数据稀疏
处理稀疏向量能力差，容易出现头部效应
无法引入其他信息：用户年龄、商品描述等

2.矩阵分解

1) 分解隐含向量维度k，取值越大表达能力强，泛化能力弱。

2) 分解方法：

奇异值分解缺点：要求原始矩阵稠密；分解复杂度达到
特征值分解
梯度下降法消除用户和物品打分偏差

$\underset{q^*,p^*}{min}\sum(r_{ui} - q_i^Tp_u)^2 + \lambda(\parallel q_i \parallel ^2 + \parallel p_u \parallel ^2) \\ \underset{q^*,p^*}{min}\sum(r_{ui} - \mu - b_u - b_i - q_i^Tp_u)^2 + \lambda(\parallel q_i \parallel ^2 + \parallel p_u \parallel ^2 + b_u^2 + b_i^2)$