直播推荐、搜索中的召回、相关性、多目标精排、特征、重排 - 多业务精排(2)

learner_ctr

已于 2022-08-10 12:15:22 修改

阅读量869

点赞数

分类专栏：精排模型(多目标、多场景模型) 文章标签：算法

于 2022-03-31 00:30:20 首次发布

本文链接：https://blog.csdn.net/a1066196847/article/details/123832622

版权

精排模型(多目标、多场景模型) 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

在前面的文章中，是针对一个场景的ctr cvr或者dur、次活这种多目标的一些知识点讲解。对于一个业务比较多的app/软件，比如美团中的多业务（美团外卖、美团买菜、机票、酒店...）、淘宝里面的首页商品推荐、搜索商品、逛逛（从他们公开的文章中，没有对这些不同的场景进行统一建模，还是各自在各自的场景中进行优化）、腾讯应用宝里面的首页推荐、激活页推荐、更新后推荐、搜索（从他们公开的文章中，没有对这些不同的场景进行统一建模，还是各自在各自的场景中进行优化），实际上可以探索下多场景建模。美团在这个里面就做了很多探索，走在了行业领先位置陈胜：美团搜索排序实践

下面对里面一些没有说到的细节和重点记录下

一、多路融合层

可以看到只有用户侧特征（query也是用户侧特征），没有item特征，其中context特征指的是用户访问美团时候的一些信息，比如时间戳等。那么这就是个多分类模型，以用户的每次请求作为样本，最终目标是预测这个用户在这三个业务是否点击/下单（三个业务可以是酒店、到家、餐饮），最后一层是softmax，也就是3个数值。从文章中描述看：

将输出作用至每一路进行融合，那说明这3个业务还是各自有各自的召回路，softmax的数值目的只是用来衡量这个用户在3个业务最有可能点击/下单哪个业务，然后哪个业务就多召回点，就是一个配额功能。这个分数可能会乘以一个召回基数（每个业务的召回基数也是不同的）

后面他们还针对后面的softmax层做的细了一点，就是讲召回方式和业务进行二阶交叉形成更详细的召回链路

上面6路分别是

1:lbs召回+酒店业务

2：lbs召回+外卖业务

3：文本召回+外卖业务

4：文本召回+餐饮业务

5：向量召回+ 餐饮业务

6：向量召回+ 到家业务

二、多业务精排层，一般的多业务/多网络在最上面都会是不同的塔，有多少目标就有多少塔，但是美团这篇文章多个业务最上面对应多个权重然后汇集在一起得到预测打分，博主暂时没有搞懂这样的原因，先看成多塔来学习吧

补充：首先这样训练可以同时训练出来多个业务的独有网络，其次可以训练出来每个网络的权重，这也是这个用户输入这个“query”时最有可能产生ctr的一个业务，那么这个业务对应的每个item的得分应该会乘以这个w，然后再统一进行排序

1：mbn-v1

每个子网络有自己专属业务的特征加在“共享层”后面

3：通过五个专家和不同的门控，使得每个业务子网络的输入特征是与业务最为相关的高层语义表征；使用LambdaLoss这种损失函数，可以同时优化score和排序指标（比如ndcg），这个在文章中没有明确指出；交叉熵的原因是模型在做预估时，每个输出都会有一个品类，希望品类对应的子网络获得的权值更高，这样可以真正使每个子网络建模对应的业务场景