「2023 | 快手」PEPNet:融合个性化先验信息的多场景多任务网络

之前梳理过多场景建模方法:推荐系统(二十四)「知识梳理」多场景建模梳理,现在介绍快手提出的多场景多任务方法PEPNet。

Title: PEPNet: Parameter and Embedding Personalized Network for Infusing with Personalized Prior Information

From: 2023 快手

Link: https://arxiv.org/pdf/2302.01115.pdf

1 背景

现在推荐系统大多为多场景多任务,如下图所示,有多个页面,每个页面视为一个场景,如快手的精选、首页、发现页面,每个场景下有多个任务,如点赞、关注、收藏等。
在这里插入图片描述

不同场景下用户和item存在重叠,具有一定共性,展现形式和时机(如单双列、购买前后)等不同,同时具有一定差异性;不同任务之间具有不同的稀疏性,同时也存在相互影响;如果在建模过程中忽略了多场景和多任务之间的共性和差异性,会影响建模效果,如果多个场景和任务不能很好地进行平衡,会存在场景跷跷板(domain seesaw)和 任务跷跷板(task seesaw)现象。

针对上面问题,论文提出一种PEPNet网络(Parameter and Embedding Personalized Network),是一种高效、低成本部署、即插即用的方法,并在快手全量上线。

2 方法

网络结构如下图所示,主要包含Gate Nu、EPNet和PPNet三部分:

  • Gate NU:基于先验信息的门控结构,是EPNet和PPNet的基本单元;
  • EPNet:场景信息作为输入,增强模型对用户跨域行为的底层感知能力;
  • PPNet:用户和item信息作为门控输入,适配不同任务每层参数,平衡顶层任务间相互依赖关系;
    在这里插入图片描述

2.1 Gate Neural Unit(Gate NU)

如下图,由两层FC构成,第一层激活函数为relu,第二层激活函数为sigmoid,第二层结果乘2作为输出,从而把输出取值从[0, 1]转化为[0, 2]
在这里插入图片描述

2.2 Embedding Personalized Network(EPNet)

如下图,场景特征(场景ID或场景特有特征)作为输入,通过Gate NU得到门控网络结果,门控网络结果和Embedding层结果进行element-wise相乘后,得到融入场景信息的Embedding结果,作为后续DNN和PPNet输入。
在这里插入图片描述

2.3 Parameter Personalized Network(PPNet)

如下图,[融入场景信息的Embedding结果、用户id、Item id、作者id] concat在一起作为输入,通过Gate NU得到门控结果,然后与DNN层结果element-wise相乘后,作为下一层DNN的输入。其中,融入场景信息的Embedding结果作为输入,为了不影响EPNet对embedding的更新和学习,训练过程中梯度不进行回传。
在这里插入图片描述

2.4 部署工程优化

(1)Feature score eliminationstrategy

为了确保系统能长时间运行,避免embedding参数很快填满机器内存,设计一个特殊的参数服务器来实现无冲突和内存高效的全局共享embedding表​。​

(2)DNN/Embedding layer Updating

模型采用在线学习,用户、item和作者不断新增,导致id特征会快速膨胀,同时存在大量过期或低频的ID,所有ID特征都存储会导致效率不高,带来额外的存储和计算开销,针对该问题,采用​两种策略:

对特征设置特定数量,超过的被删除
对特征设置过期时间,保留频繁更新的特征ID,删除未得到更新的特征

(3)Training strategy

在实践中,ID特征更新速度较快,在线学习的情况下为了更好地捕获底层embedding变化,同时稳定更新顶层DNN参数,embedding和DNN参数采用不同的更新策略,其中embedding层采用AdaGrad优化器,学习率为0.05,而DNN层采用Adam优化器,学习绿5e-6。

​3 实验

(1)与其他方法对比
在这里插入图片描述

(2)消融实验
在这里插入图片描述

(3)线上效果

在这里插入图片描述

往期推荐:

推荐系统中提升用户留存算法

推荐系统(35) 序列建模文章梳理

推荐系统(32)「梳理」知识蒸馏优化粗排模型

推荐系统(30):2022顶会CTR相关论文梳理

推荐系统(26) 2022 Q2工业界推荐算法实践经验梳理

推荐系统(十一) 2021-2022年工业界推荐算法实践经验汇总

推荐系统(二十四)「知识梳理」多场景建模梳理

推荐系统,离线AUC涨了10%之多,在线CTR等效果可能一点都不涨吗?

  • 16
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WitsMakeMen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值