推荐系统全链路设计:原理解读与业务实践

推荐系统全链路设计:原理解读与业务实践

在这里插入图片描述

主页传送门:📀 传送

概述


  推荐系统中的冷启动分为物料冷启动和用户冷启动。用户冷启动主要是针对新用户,但有时候也用于低活用户拉活。物料冷启动主要是让优质物料得到快速下发,让模型可以迅速捕获到用户对该物料的关注。本文将详细讲解用户冷启动和物料冷启动。

1、用户冷启动


  用户冷启动就是通过物料钩子、注册信息、多域信息、联邦学习等各种技巧去迅速获取用户的兴趣点实现个性化推荐,激发用户的留存。此外针对新用户还需要考虑定期刺激用户兴趣,不断用优质物料去试探用户,甚至做到兴趣的流转和承接,迅速抓住用户的兴趣,提高用户黏性。比如,针对信息流推送业务的用户进行冷启动,当一个新用户点击某条推送物料后,用户会迅速进入信息流的某个业务界面(如图文或者视频界面),这时候,对应的业务界面也要做好对应的承接推荐,继续给用户优质的物料,让用户深入地使用该产品,而不是用户点完一个物料以后就完毕了。因此,对承接页的物料展示位的填充就很讲究了,首先,基于推送的I2I物料肯定是要有的;其次,用户的其他兴趣点物料和高热度物料也要着重考虑。同时,对于相同的用户冷启动“打法”,除了针对新用户,也可以定期针对低活用户进行拉活冷启动。用户流失其实是一个常见的问题,关键还是要分析用户为什么流失的问题,比如用户物料兴趣得不到满足,有违规内容,App的生态运转不良,竞品用其他手段拉走了用户等。通过分析得到问题后,就要针对这部分低活用户进行类似冷启动的“打法”,并且做好一系列的兴趣承接工作让用户重新回到App里面。

2、物料冷启动


  物料冷启动主要是针对新入库不久的物料,让其得到迅速下发,从而筛选出好的物料,产生流量的“滚雪球”效应。物料冷启动方法很多,主要包括用户粉丝冷启动、物料基础信息冷启动、物料相似性冷启动和物料进退场机制(具体请阅读《推荐系统全链路设计:原理解读与业务实践》一书)。

  现在的主流“打法”是物料进退场机制(也称作爬坡机制)。物料进退场机制主要是为每个物料设置一级级的限制,然后就是设置物料爬坡的限制,之后再根据各个业务情况去设置更进一步的流量筛选条件,直到最后物料流入正常流量库。下图展现了整个冷启动物料到正常物料的流程。

图片

      图11-1 冷启动物料到自然流量物料库的转换

  冷启动流量需要考虑流量放量的速度和物料、用户的基础特征,相比自然流量的模型,冷启动环节的模型需要忽略反馈数据,如点击、下发、点赞、评论等。

3、PID算法


  在流量分发的过程中,肯定不可能一次性爆发式地分发下去,而是间隔式地均匀分发。因为,流量在不同时段的量都是不同的,而且物料肯定不应该被集中式下发,应该在各个时段都有分发。所以,为了合理的分发物料,需要对物料流量进行合理的控制,PID(Proportion Integration Differentiation,比例-积分-微分控制器 )就是流量控制的典型算法。

  PID算法分为比例、积分和微分三部分,是控制领域的常见稳定控制算法。具体公式如下:

图片

其中:

图片
图片

              图11-2 PID流程
  其实,PID操作类似于对热水器的水进行加热到固定水温。比如要将水温加热到40℃,一开始肯定要迅速升温,但是到35℃的时候就要减缓加温力度,到40℃就不再进行加温,只需要维持即可。怎么合理的将水温加到40℃,并且维持在40℃,就是PID需要做的事情。

  PID的核心就是在这里插入图片描述

  图片:控制当前主要误差的系数,图片越大,调节的力度越大,越激进; 图片越小,调节力度越保守。例如,假设某个物料需要发100条,要发10h,则每小时发10条(记为图片)。通过计算当前真实要发的量,图片越大,达到预期总发放量的速度越快。

  在这里插入图片描述
:如果仅仅用比例,假设我们计划发10条,但是只发了4条,这样实际发放和计划发放就存在暂态误差。如果暂态误差拉长就会变为稳态误差,所以,我们再引入一个分量,该分量和误差的积分是正比关系。由于这个积分项会将前面若干次的误差进行累计,所以可以很好地消除稳态误差。该值不宜太大,一般取0.8-2之间。

  l图片:一般指t时刻和t-1时刻的误差值,即调节控制中的振荡,通常,微分环节相当于放大了反馈信号中的高频信号。系数取得不好会,就会引起高频震荡。

  PID算法在实际的应用中就是模拟线上环境,然后对图片进行调参,让整个分发系统达到一个稳定的状态。

  下面给出将某个物料在8h内分发100条的PID算法代码。

在这里插入图片描述
  实现了以上代码后,绘制时间和物料每小时的下发关系图。

图片

图片

图片
作者:唐楠烊
来源:IT阅读排行榜
本文摘编自《推荐系统全链路设计:原理解读与业务实践》,机械工业出版社出版,经出版方授权发布,转载请标明文章来源。

延伸阅读

图片

《推荐系统全链路设计:原理解读与业务实践》

唐楠烊 著

一套基于业务场景的个性化精准推荐系统解决方案

推荐系统、NLP技术专家撰写

深度解读多层推荐系统构建和优化的原理和核心技术

内容简介:


  这是一本指导中高级从业者高质量落地现代推荐系统,围绕现代推荐系统核心技术展开深度解读的专业工具书,又是一套完整的推荐系统高质量落地解决方案。本书基于推荐算法工程师实际工作场景规划内容,融合了作者在阿里巴巴、58同城等多家大厂做推荐系统设计和优化的经验,是一本方法和实践兼具的好书。

  本书不针对零基础从业者,而是以帮助初级算法工程师向中高级进阶为目标。书中从底层剖析推荐系统在实际业务场景中可能出现的各种问题,直指问题的本质,并按照推荐系统工作流程逐一破解。

图片

文章作者:唐楠烊
来源:IT阅读排行榜
本文摘编自《推荐系统全链路设计:原理解读与业务实践》,机械工业出版社出版,经出版方授权发布,转载请标明文章来源。

原文链接:
推荐系统中冷启动环节的设计实现

购买链接:https://item.jd.com/14612336.html\

写在末尾:


根据博客阅读量本次活动一共赠书若干本
评论区抽取若干位小伙伴送出,中奖了会私信通知
参与方式:关注博主、点赞、收藏 + 评论
(任意评论不折叠即可,切记要点赞+收藏,否则抽奖无效,每个人最多评论三次)
在这里插入图片描述

  如果喜欢的话,欢迎 🤞关注 👍点赞 💬评论 🤝收藏  🙌一起讨论
  你的支持就是我✍️创作的动力!					  💞💞💞
  • 7
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

家有娇妻张兔兔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值