一文看懂推荐系统:排序03:预估分数融合

一文看懂推荐系统:排序03:预估分数融合

提示:最近系统性地学习推荐系统的课程。我们以小红书的场景为例,讲工业界的推荐系统。
我只讲工业界实际有用的技术。说实话,工业界的技术远远领先学术界,在公开渠道看到的书、论文跟工业界的实践有很大的gap,
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。

王树森娓娓道来**《小红书的推荐系统》**
GitHub资料连接:http://wangshusen.github.io/
B站视频合集:https://space.bilibili.com/1369507485/channel/seriesdetail?sid=2249610

基础知识:
【1】一文看懂推荐系统:概要01:推荐系统的基本概念
【2】一文看懂推荐系统:概要02:推荐系统的链路,从召回粗排,到精排,到重排,最终推荐展示给用户
【3】一文看懂推荐系统:召回01:基于物品的协同过滤(ItemCF),item-based Collaboration Filter的核心思想与推荐过程
【4】一文看懂推荐系统:召回02:Swing 模型,和itemCF很相似,区别在于计算相似度的方法不一样
【5】一文看懂推荐系统:召回03:基于用户的协同过滤(UserCF),要计算用户之间的相似度
【6】一文看懂推荐系统:召回04:离散特征处理,one-hot编码和embedding特征嵌入
【7】一文看懂推荐系统:召回05:矩阵补充、最近邻查找,工业界基本不用了,但是有助于理解双塔模型
【8】一文看懂推荐系统:召回06:双塔模型——模型结构、训练方法,召回模型是后期融合特征,排序模型是前期融合特征
【9】一文看懂推荐系统:召回07:双塔模型——正负样本的选择,召回的目的是区分感兴趣和不感兴趣的,精排是区分感兴趣和非常感兴趣的
【10】一文看懂推荐系统:召回08:双塔模型——线上服务需要离线存物品向量、模型更新分为全量更新和增量更新
【11】一文看懂推荐系统:召回09:地理位置召回、作者召回、缓存召回
【12】一文看懂推荐系统:排序01:多目标模型
【13】一文看懂推荐系统:排序02:Multi-gate Mixture-of-Experts (MMoE)


提示:文章目录


预估分数融合

前几节讲了多目标排序模型,

多目标模型输出对点击率、点赞率等指标的预估,

这节讲怎样去融合多个预估分数

最简单的分数融合方法就是求各种预估值的加权和
在这里插入图片描述

这第1项p click意思是模型预估的点击率,它的权重是一,
这第2项p like是模型预估的点赞率,它的权重是W1,
后面还有很多项,包括预估的收藏率、转发率、评论率等等。

这是另一种简单的容分公式,
在这里插入图片描述

括号外面是点击率的预估,括号里面是很多项的加权和。

这个公式有实际意义
p click乘以一
就是预估的点击率p click
p click乘以p like意思是曝光之后用户点赞的概率
为什么?
在这里插入图片描述

P click是曝光之后用户点击的概率。
P like是点击进去之后,用户在点赞的概率
两者相乘就是曝光之后用户点赞的概率

这里讲的两种融合公式都很简单,在工业界都挺常用。
海外某短视频APP用这样的融分公式
在这里插入图片描述

跟前面讲的加权和有些区别。
p time的意思是预估短视频的观看时长,比如预测用户会观看十秒,
整个这一项是一加上w1乘以p time再取alpha1次方。
这里的W1和alpha1都是超参数,需要手动调现场做ab测试,选出合适超参数,

这第2项类似是对点赞率的函数变换,用了不同的超参数,有很多个预估指标,做函数变换,得到很多项,
把它们取连成作为最终的融合份数。

抖一抖短视频的融分公式完全和常规不同

国内某个老铁的抖一抖视频APP的融分公式很有意思,跟前面介绍的几种方法完全不一样。
在这里插入图片描述

其中标排序模型给N个候选视频打分,得到预估的播放时长、点击率、点赞率、转发率等指标。

以预估时长p time为例,暂且只用p time这一个分数对N个候选视频做排序,
如果某个视频的排名是r time,
则它的分数为一除以r time的alpha1次方 加Beta
公式里的alph和Beta都是需要调的超参数。
很显然,预估的播放时长越长,排名就越靠前,R time就越小,最终得分就越高

上面按照预估的播放时长做排序,得到一个分数。
如果按照预估的点击率做排序,会得到另一个分数,
由点击,点赞,转发,评论等很多指标,那么一个视频会有很多排名,
每一个排名变成一个分数,对所有这些分数求加权和,就是最终的融合分数。
这个融分公式跟前几种都不太一样,

这里不是直接用预估的分数,而是用每个公式中的r time, r click, r like是某篇笔记的三个排名,
分别是按照预估时长、预估点击率和预估点赞率做排序,得到的分数,

国内某电商的容分公式

在这里插入图片描述

电商的转化流程是这样的,曝光、点击、加购物车,最后是付款模型。

要预估中间每一步的转化率,包括从曝光到点击,从点击到加购物车,从加购物车到付款,上面那个是最终的容分公式。

把预估的点击率加购物车率付款率、物品价格都乘起来,
指数阿尔法一到阿尔法4是超参数需要调。
假如阿尔法一到,阿尔法四都等于一,
那么这个公式就是电商的营收有很明确的物理意义——即成交价格

这节简要介绍了工业界排序的几种融分公式,加权、排序加权、转化率连乘等


总结

提示:如何系统地学习推荐系统,本系列文章可以帮到你

(1)找工作投简历的话,你要将招聘单位的岗位需求和你的研究方向和工作内容对应起来,这样才能契合公司招聘需求,否则它直接把简历给你挂了
(2)你到底是要进公司做推荐系统方向?还是纯cv方向?还是NLP方向?还是语音方向?还是深度学习机器学习技术中台?还是硬件?还是前端开发?后端开发?测试开发?产品?人力?行政?这些你不可能啥都会,你需要找准一个方向,自己有积累,才能去投递,否则面试官跟你聊什么呢?
(3)今日推荐系统学习经验:这节简要介绍了工业界排序的几种融分公式,加权、排序加权、转化率连乘等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冰露可乐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值