推荐系统的技术架构

推荐系统从技术架构的层面来讲,分为两大部分:数据部分模型部分

数据部分完成的工作主要集中在数据收集、数据清洗与处理上,采用实时与离线的方式对用户、物品、场景三类数据数据处理与清洗,并以特定的格式提供给推荐系统中的使用方(文中提到的有三个:模型训练、模型预测、商业智能),可见数据的重要性,数据处理流程如果出现了问题,后面的工作可能均无法正常开展。 tips: 实时与离线数据处理架构即为当前常用的lambda架构。

模型部分完成的工作分别是:模型训练、模型评估、模型部署及模型在线推断。

模型”这里,推荐系统一般存在三个阶段:召回、精排、重排,每个阶段都会存在一个到多个模型。不同的模型,会使得不同的阶段对最终的推荐结果产生改变。一般,算法工程师会把模型选型作为一个算法问题,如何对业务进行有效建模才能获得最大的收益。

其他的,“训练”、“评估”、“部署”、“在线推断”一般被看作一个工程问题,即如何将模型有效的apply。

首先,模型训练分为离线训练在线更新。离线训练一般是取全量样本训练模型,为得到理论上的全局最优点;在线更新是实时构造样本,进而更新模型,这种方式容易使得模型收敛到局部最优点,一般学习到的是数据的趋势,例如热点等。

模型评估同样分为离线评估线上A/B测试。离线评估应用于模型上线前评估模型效果,线上A/B测试则直接利用线上流量,效果更加直观准确。

模型部署和在线推断即为模型接受用户query后返回推荐item列表的过程。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值