今天给大家分享的是谷歌发表的一篇用于点击率预估中消除位置偏差的论文,除考虑位置本身的影响外,还考虑了相邻位置及展示的item的交叉影响,一起来看一下。
1、背景
在点击率预估问题中,位置偏置是一类比较常见的问题,展现位置更靠前的广告无论是否真正符合用户的兴趣,都有更高的概率被点击。
过往也有一些工作来解决位置偏置的问题。最常见的做法是将位置特征作为一个模型训练的一个特征,而在线上预测时,所有候选广告使用相同的位置特征输入。这种方案实现较为简单,但是线上预测时,选择不同的位置,得到的推荐结果会存在差异,结果往往是次优的。
华为提出的PAL框架将广告被点击的概率分为两个因素:广告被用户看到的概率和用户看到广告后点击的概率。论文做了进一步的假设:用户是否看到广告只跟广告的位置有关系;同时,用户看到广告后,是否点击广告与位置无关。因此整个框架也是包含两个部分,如下图所示。在线上预测时,只需要部署右边的网络,所得到的点击率就是消除了位置偏置后的点击率。这种方案的缺点是假设太强,将问题过于简化了,没有充分考虑位置偏置与相邻位置及展示的item的交叉影响。