基础架构（一）

最新推荐文章于 2022-11-20 21:26:51 发布

StellaLiu萤窗小语

最新推荐文章于 2022-11-20 21:26:51 发布

阅读量166

点赞数

分类专栏：深度学习推荐系统 # 基础架构

本文链接：https://blog.csdn.net/anqi3776/article/details/113667504

版权

深度学习推荐系统同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

基础架构

3 篇文章 0 订阅

订阅专栏

基础架构（一）

推荐系统要处理的问题就可以被形式化地定义为：对于某个用户U（User），在特定场景C（Context）下，针对海量的“物品”信息构建一个函数，预测用户对特定候选物品I（Item）的喜好程度，再根据喜好程度对所有候选物品进行排序，生成推荐列表的问题。
在这里插入图片描述

在这里插入图片描述

第一部分：推荐系统的数据部分

推荐系统的“数据部分”主要负责的是“用户”“物品”“场景”信息的收集与处理。根据处理数据量和处理实时性的不同，我们会用到三种不同的数据处理方式，按照实时性的强弱排序的话，它们依次是客户端与服务器端实时数据处理、流处理平台准实时数据处理、大数据平台离线数据处理。在实时性由强到弱递减的同时，三种平台的海量数据处理能力则由弱到强。

使用 Spark 进行离线数据处理，使用 Flink 进行准实时数据处理等等。大数据计算平台通过对推荐系统日志，物品和用户的元数据等信息的处理，获得了推荐模型的训练数据、特征数据、统计数据等

大数据平台加工后的数据出口主要有 3 个：

生成推荐系统模型所需的样本数据，用于算法模型的训练和评估。
生成推荐系统模型服务（Model Serving）所需的“用户特征”，“物品特征”和一部分“场景特征”，用于推荐系统的线上推断。
生成系统监控、商业智能（Business Intelligence，BI）系统所需的统计型数据。

第二部分：推荐系统的模型部分

推荐系统的“模型部分”是推荐系统的主体。模型的结构一般由“召回层”、“排序层”以及“补充策略与算法层”组成。其中，
“召回层”一般由高效的召回规则、算法或简单的模型组成，这让推荐系统能快速从海量的候选集中召回用户可能感兴趣的物品。

“排序层”则是利用排序模型对初筛的候选集进行精排序。

而“补充策略与算法层”，也被称为“再排序层”，是在返回给用户推荐列表之前，为兼顾结果的“多样性”“流行度”“新鲜度”等指标，结合一些补充的策略和算法对推荐列表进行一定的调整，最终形成用户可见的推荐列表。从推荐系统模型接收到所有候选物品集
在这里插入图片描述
模型的训练方法根据环境的不同，可以分为“离线训练”和“在线更新”两部分。

其中，离线训练的特点是可以利用全量样本和特征，使模型逼近全局最优点，而在线更新则可以准实时地“消化”新的数据样本，更快地反应新的数据变化趋势，满足模型实时性的需求。

除此之外，为了评估推荐系统模型的效果，以及模型的迭代优化，推荐系统的模型部分还包括“离线评估”和“线上 A/B 测试”等多种评估模块，用来得出线下和线上评估指标，指导下一步的模型迭代优化。

Netflix 的推荐系统的经典架构图

在这里插入图片描述
数据部分：event distribution, hadoop, query results, netflex.hermes, user event queue, netflix.manhattan.
模型部分：model training, models, online computation, online service, algorithm service.

StellaLiu萤窗小语

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基础架构（一）

基础架构（一）第一部分：推荐系统的数据部分第二部分：推荐系统的模型部分Netflix 的推荐系统的经典架构图推荐系统要处理的问题就可以被形式化地定义为：对于某个用户U（User），在特定场景C（Context）下，针对海量的“物品”信息构建一个函数，预测用户对特定候选物品I（Item）的喜好程度，再根据喜好程度对所有候选物品进行排序，生成推荐列表的问题。第一部分：推荐系统的数据部分推荐系统的“数据部分”主要负责的是“用户”“物品”“场景”信息的收集与处理。根据处理数据量和处理实时性的不同，我们会
复制链接

扫一扫

专栏目录