论文题目: MOBIUS: Towards the Next Generation of Query-Ad Matching in Baidu’s Sponsored Search
论文地址: https://dl.acm.org/doi/abs/10.1145/3292500.3330651
论文发表于: KDD 2019(CCF A类会议)
论文所属单位: Baidu
论文大体内容:
本文主要提出了一个基于Active Learning的数据增强算法——MOBIUS(莫比乌斯),用于解决百度凤巢中广告推荐中提升CPM(Cost Per Mille,展现成本,或者叫千人展现成本)问题。
Motivation:
传统的广告推荐中往往会将触发和排序分开做,但由于各自的目标不一样,会导致广告推荐出现PXTR值很高,但是相关性很低的bad case。本文提出基于Active Learning的数据增强算法MOBIUS来解决这个问题。
Contribution:
本文作者在传统的CTR模型上,增加数据增强部分,提升广告推荐中的相关性,从而提升CPM。
1. 传统的2层结构来计算广告(如下图)。
①触发;
②排序;
2. 传统方法有个明显的问题,相关性低而PXTR高的结果,会被排出来,这样会导致CPM比较低。如下图为论文给出的bad case。
3. 本文提出基于Active Learning的数据增强算法,对log进行全局采样,然后将相关性低于阈值且PXTR高的样本,作为bad case的增强样本,放入训练中学习,从而降低这种bad case。
4. 本文还包含ANN Search模块,业界常用的比如Annoy、Faiss;
实验
5. 实验结果
离线AUC降低了,但是相关性提升,人工评测效果提升,线上CPM收益明显。
以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!