今天介绍一篇美团在SIGIR 2021中稿的一篇short paper,主要介绍在解决点击率预估中位置偏置(position-bias)方面的一些工作,一起来看一下。
1、背景
在点击率预估问题中,位置偏置是一类比较常见的问题,展现位置更靠前的广告无论是否真正符合用户的兴趣,都有更高的概率被点击。
过往也有一些工作来解决位置偏置的问题。最常见的做法是将位置特征作为一个模型训练的一个特征,而在线上预测时,所有候选广告使用相同的位置特征输入。这种方案实现较为简单,但是线上预测时,选择不同的位置,得到的推荐结果会存在差异,结果往往是次优的。
华为提出的PAL框架将广告被点击的概率分为两个因素:广告被用户看到的概率和用户看到广告后点击的概率。论文做了进一步的假设:用户是否看到广告只跟广告的位置有关系;同时,用户看到广告后,是否点击广告与位置无关。因此整个框架也是包含两个部分,如下图所示。在线上预测时,只需要部署右边的网络,所得到的点击率就是消除了位置偏置后的点击率。这种方案的缺点是假设太强,将问题过于简化了,没有充分考虑位置偏置与用户特征、上下文特征以及候选item之间的关系。
本文要介绍的文章提出了深度位置交互网络(Deep Position-wise Interaction Network,后文简称DPIN)来有效的建模候选广告在每个位置的点击率,同时使用贪婪的策略对候选广告进行排序,一起来看一下DPIN的结构。
2、DPIN介绍
假设有J个候选广告、K个位置,每次计算的耗时为C,那么预测J个广告在K个位置的整体时间复杂度为O(JKC),这显然是线上扛不住的。因此论文将整个DPIN拆解为了三个模块,分别是base module、de