RecHcb:Task01
前言
学习直播PPT,对Torch-RecHub有了基本的认识,对项目的整体架构有了基本了解,跑了下参考案例中的dssm;
一、推荐系统系统概述
1.1 推荐系统的意义
推荐系统能给平台放带来巨大的商业价值;推荐系统提升用户体验,增强用户对平台的依赖程度;推荐与搜索区别:用户意图,个性化程度,优化目标;
1.2 推荐系统架构
解释图:
推荐系统架构:离线层、近线层、在线层;
离线层:
不用实时数据,不提供实时响应,主要是对数据处理、数据存储,特征工程、离线特性的计算,离线模型的训练,可处理大量数据进行大规模特征工程,但不能实时响应;![在
近线层:
使用实时数据,不保证实时响应,介于离线和在线之间,特征的实时更新计算,实时训练数据获取,模型实时训练;
在线层:
实时数据,实时响应,最大特点是对响应延时的要求,主要进行模型在线服务,快速召回、排序,在线特征处理拼接,AB实验,运筹优化和业务干预;
1.3 算法架构
整体分为:物料库-》召回-》粗排-》精排-》重排;
召回:目标候选出万量级item,减小排序层面压力;
粗排:精排前的过滤机制,目的也是减轻精排模块的压力,介于召回和精排之间,兼顾精确性和低延迟;
精排:目标选出最优的topn,对候选出点item进行模型打分;
重排:是对精排生成topn的item重新排序,会进一步根据策略、业务、运营规则等进行进一步排序;
混排:多个业务线想获取曝光,则对结果进行混排;