KDD2021|腾讯联合中科院北航提出人群扩展算法MetaHeac并用于推荐和广告领域(已开源)...

Learning to Expand Audience via Meta Hybrid Experts and Critics for Recommendation and Advertising

Yongchun Zhu, Yudan Liu, Ruobing Xie, Fuzhen Zhuang, Xiaobo Hao, Kaikai Ge, Xu Zhang, Leyu Lin and Juan Cao

Chinese Academy of Sciences, Beihang University, Tencent

https://dl.acm.org/doi/pdf/10.1145/3447548.3467093

在推荐系统和广告平台中,广告营销人员通常会在多个媒体渠道对潜在受众发布产品、内容或者广告,这里的渠道包括视频或者社交软件等。

给定一系列受众或消费者,即种子用户,人群扩展算法,即lookalike模型,对于识别高潜受众,是一个不错的解决方案。这里的高潜受众即为跟种子用户比较相似的,并且很有可能会完成目标活动的商业目标。

但是,lookalike模型面临两个挑战,其一,实际应用中,公司每天可以运行数以百计的营销活动,这些活动的内容多种多样,并且类别也完全不同,比如体育、政治、社会等。因此,利用通用方法对所有活动进行人群扩散比较困难。其二,特定活动的种子集合只会覆盖有限的用户,因此,基于此种子集合的定制化方法很有可能会过拟合。

这篇文章中,为了解决上述两个挑战,作者们提出一种新的二阶段框架,即元混合专家及判别,该框架已经部署在微信lookalike系统中。在离线阶段,生成式模型可以捕捉多种任务之间的关系,该模型是在所有现有营销任务中利用元学习角度来训练的。在线上阶段,对于新的营销活动,基于生成式模型和给定的种子用户集合,可以学习定制化模型。

离线和在线实验表明,所提方法,MetaHeac在内容营销活动的推荐系统中取得了较好的效果,同时在广告平台中的广告营销中也取得了很好的效果。

很多营销活动的种子用户都是很少的,只有几百个

4b08765239025322a259203e2eee3238.png

该论文作者认为现有二阶段(offline + online)方法的不足有以下三点

8f5facdbd3713498bb39e0b5dec83a9e.png

MetaHeac主要基于以下两个想法

94a7dd36e5808f3bff4d9207564deedc.png

这篇文章的主要贡献如下

c79f4be3ddf6bda4aa3e94ba071629e6.png

微信lookalike系统结构图示如下

da11133ce734aa982ce6e73226a82b71.png

微信lookalike系统中模型的训练周期、更新周期及召回耗时信息如下

575179fee7cbb5d44aadacfa5f26a837.png

作者们所提模型基于元学习的思想,元学习可以完成以下目标

ffd23f5aaa4de1f5a466a45c1e0a67f9.png

人群扩展可以分为以下两个步骤

8d7275c4b94220f800ca0bc140f51eb0.png

其中理解阶段简介及目标函数形式如下

8678be57669539bd79d10c194a1aab31.png

从元学习的角度训练MetaHeac算法伪代码如下

5d334b00d15d86b238494fc6e6197443.png

作者们提出任务驱动的混合专家算法

30dc623a8e043e0278e5d648063e8c4d.png

作者们还提出了任务驱动的多判别家方法

d8d4df9453cc1283dbab4bfabd73be3a.png

模型整体结构图示如下

e9325a642cacb4d4223eb0881a0fa880.png

数据集信息简介如下

e3e7e95a497fb4caba65d0b3bec54520.png

数据集信息统计如下

96c2f7780e95fb238628a9167a7e32a4.png

正负样本比设置如下

5d13e87d354921708b4b0c6ebea81e7d.png

参与对比的方法分为以下三大类

c9baddc6d077e5f87eba651d74fa2b86.png

1ae304896118578e31680423e8254230.png

17a0aba40f8940f1f717225e9025e8b7.png

实验参数设置如下

c1913d10406005b9e96a24ca87bfc8c7.png

作者们采用了以下评估指标

c9718ac02c2521307d75662b6e4ae793.png

9700873d0a334f6e7812165f03e3cfa1.png

几种方法的效果对比如下

bab1b03bd59a139902147bf26589876e.png

线上ab效果统计如下

48d36b0399ed6d340d05111bd52b8e0b.png

为验证各个部分的有效性,作者们进行了消融实验,效果如下

1f1418b490c802d03418883ed59f5053.png

几种模型的收敛速度对比及作者们所提模型表示图示如下

cde21abddbe8542cb0419826068aaedf.png

基于规则和基于相似度的人群扩展方法简介如下

b639ebd0daa14ec92bb9e0abf4cdc4a6.png

基于模型的方法也可以用于人群扩展

8d2e26b5ca1bd33898e6dd98485f0c81.png

代码地址

https://github.com/easezyc/MetaHeac


              201b8cf4a1b9210739b86059ec60c5a3.png我是分割线fe2f84fcbe3f8bb81573b5916b4fd81d.png


您可能感兴趣

KDD2020|阿里提出多目标优化保量算法并用于优酷视频服务平台

KDD2020|腾讯联合中科大提出请求级别保量广告计划RAP

KDD2020|淘宝推荐中的特权特征蒸馏算法PFD

KDD2020|阿里联合香港理工大学提出多任务多视角图表示学习框架M2GRL(已开源)

KDD2020|字节联合密歇根州立大学提出推荐广告联合训练框架RAM(已开源)

KDD2020|阿里联合清华提出多兴趣框架ComiRec用于序列推荐(已开源)

KDD2020|京东提出图像类别卷积神经网络CSCNN用于视觉感知CTR预估

亚马逊联合纽约州立大学提出元学习算法MetaBridge用于电商有限标注数据情况下自动验证文本属性

KDD2020|腾讯基于app使用行为提出AETN用于构建通用型user-embedding(已开源)

KDD2020|阿里联合武大提出对偶异构图注意力网络DHGAT用于提升长尾商铺搜索效果

KDD2020|蚂蚁金服提出人群扩展算法Hubble用于智能营销

实时注意力lookalike模型RALM在推荐系统中的应用

召回--联合训练树的索引和深层模型在推荐系统中的应用

深度神经网络在Youtube推荐中的应用--开篇作之一--含部分实用技巧

BERT深层双向Transformers预训练在语言理解中的应用

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值