Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings
Feiyang Pan, Shuokai Li, Xiang Ao, Pingzhong Tang, Qing He
Tsinghua University, Chinese Academy of Sciences
https://arxiv-export-lb.library.cornell.edu/pdf/1904.11547
点击率预估在计算广告中是最核心的问题之一。近期,embedding技巧,将广告id映射到低维空间表示,可以大幅提升点击率预估的准确性。
但是,这种学习方法需要大量数据,对于小日志数据的情形,对新广告的效果表现较差,此即冷启动问题。
这篇文章中,当新广告加入到候选集时,作者们旨在提升冷启动阶段和热身阶段的点击率预估效果。作者们提出元embedding,这是一种基于元学习的方法,对新广告id,可以学习产生期望的初始embedding。
作者们所提方法对新广告id训练了embedding生成器,其中基于梯度元学习方法充分利用了先前学到的广告。这种方法可以学习如何学到更好的embedding。对于新广告,训练的生成器初始化广告id的embedding时将内容和属性作为输入。
然后,生成的embedding相对其他现有的初始化方法可以加速热身阶段的模型拟合,可以比较好的处理只有少量打标样本可用的情形。
在3个真实数据集上的实验结果表明,元embedding可以显著提升冷启动和热身阶段的效果,作者们在6个现有点击率预估模型上验证了该效果,其中包含轻量级模型,比如因子分解机,也包含复杂深度模型,比如PNN和DeepFM。这种方法也可以用于转化率预估。
少部分广告占了大部分样本示例如下
这篇文章的主要贡献如下
冷启动与热启动区别对比如下