SIGIR2019|中科院联合清华提出基于ID嵌入Meta-Embedding算法优化冷启动广告

文章介绍了在计算广告领域,针对冷启动问题,研究者提出了元embedding(Meta-Embedding)算法。通过元学习方法训练广告ID的生成器,以内容和属性为输入,为新广告生成初始embedding。实验证明,这种方法能有效提升冷启动和热身阶段的点击率预估效果,适用于多种模型,包括轻量级和深度模型。
摘要由CSDN通过智能技术生成

Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings

Feiyang Pan, Shuokai Li, Xiang Ao, Pingzhong Tang, Qing He

Tsinghua University, Chinese Academy of Sciences

https://arxiv-export-lb.library.cornell.edu/pdf/1904.11547

点击率预估在计算广告中是最核心的问题之一。近期,embedding技巧,将广告id映射到低维空间表示,可以大幅提升点击率预估的准确性。

但是,这种学习方法需要大量数据,对于小日志数据的情形,对新广告的效果表现较差,此即冷启动问题。

这篇文章中,当新广告加入到候选集时,作者们旨在提升冷启动阶段和热身阶段的点击率预估效果。作者们提出元embedding,这是一种基于元学习的方法,对新广告id,可以学习产生期望的初始embedding。

作者们所提方法对新广告id训练了embedding生成器,其中基于梯度元学习方法充分利用了先前学到的广告。这种方法可以学习如何学到更好的embedding。对于新广告,训练的生成器初始化广告id的embedding时将内容和属性作为输入。

然后,生成的embedding相对其他现有的初始化方法可以加速热身阶段的模型拟合,可以比较好的处理只有少量打标样本可用的情形。

在3个真实数据集上的实验结果表明,元embedding可以显著提升冷启动和热身阶段的效果,作者们在6个现有点击率预估模型上验证了该效果,其中包含轻量级模型,比如因子分解机,也包含复杂深度模型,比如PNN和DeepFM。这种方法也可以用于转化率预估。

少部分广告占了大部分样本示例如下

9f9e8c7e18d763fe0f1b7ac4f64d4a68.png

这篇文章的主要贡献如下

1dfe86813878e06f77fae562e9286fb7.png

冷启动与热启动区别对比如下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值