【推荐系统笔记】-1.排序服务相关

KryHan

于 2022-03-30 00:26:09 发布

阅读量230

点赞数

分类专栏：【推荐系统】笔记文章标签：推荐系统排序服务

本文链接：https://blog.csdn.net/qiyihan/article/details/123835370

版权

【推荐系统】同时被 2 个专栏收录

15 篇文章 4 订阅

订阅专栏

笔记

4 篇文章 0 订阅

订阅专栏

精排服务框架介绍

框架流程图

任务调度：任务监控平台、任务定时管理
排序服务：FM排序模型、DNN排序模型、DeepFM排序模型
引擎：请求
机器学习平台：数据流服务，排序模型训练平台、模型部署平台
特征服务：item特征、user特征
参数服务：key-value结构数据
简单来说就是，先搭建平台，然后通过模型训练，最后进行排序输出

排序服务相关-机器学习平台

数据流服务：产生训练所需的训练样本
训练平台：模型开发和训练的统一平台
模型部署平台：负责各种模型的文件的部署后用于线上预估

数据流服务

离线：日志数据—>数据流统一处理平台---->按小时或者按天训练数据---->离线训练
在线：日志数据—>数据流统一处理平台---->按batch组织数据---->在线训练
CTR-----点击为正样本/未点击为负样本（点击行为–曝光行为）

排序模型训练平台

---->离线训练---->离线训练平台---->离线模型文件
---->在线训练---->在线训练服务---->Ps/在线服务

模型部署平台

---->离线模型文件👇
---->开启预估服务服务
---->Ps/在线服务👆

排序服务相关-参数服务器

分布式机器学习分成两部分，及参数和训练：
对于大型的算法，比如DNN、CNN，参数上亿的时候，自然需要一个集群俩存储这么多的参数，因而，参数服务器就是专门用来存储这么多参数的服务。
训练部分自然是并行的，不然无法体现分布式机器学习的优势。因为参数服务器的存在，每个计算节点在拿到新的batch数据后，都要从参数服务器上取下最新的参数，然后计算梯度，再将梯度更新会参数服务器。
小样本---------一台或不用
大规模样本-----------使用参数服务器–分布式
参数服务器通常对外提供两个方法：push和pull
在参数服务中，参数都是可以被表示成（key、value）的集合，key就是feature ID，二value就是他的权值。
把参数表示成k-v，形式更自然，易于理解，更易于变成理解。workers跟servers之间通过push与pull来通信，worker通过push将计算好的梯度发送到server，然后通过push从server更新参数。