聊一聊搜索推荐中的 Position Bias

e08ed990ed2c9b58373e74bb306e63e9.png

作者 | Chilia   

哥伦比亚大学 NLP搜索推荐  

整理 | NewBeeNLP

在搜索推荐系统中,Bias可以说无处不在。之前我们整理过搜索、推荐、广告中的曝光偏差问题,今天来看看 position bias。

1. 什么是position bias

Position-Bias是指 item 在展示页面的排序位置,及其相对广告的位置等。经验和有关论文都告诉我们,这种位置会影响item的点击率。这种影响跟用户的「真实兴趣」无关,而是跟用户的注意力、用户对广告的情绪有关。

例如有眼动实验表示用户会很少关注那些在列表靠下的item。离线分析显示,排在前面的文章一般比排在后面的文章点击率高,离广告近的文章点击率一般较低,这种bias被称为position-bias。用户更愿意点击排在前面的商品,之后这些商品就越容易排在前面... 这样就形成了一个正反馈循环,让推荐生态恶化, 形成“强者愈强、弱者愈弱”的马太效应

为了有更高的CTR预估精度,CTR预估从早期的LR、FM、FFM等支持大规模稀疏特征的模型,到XGBoost、LightGBM等树模型的结合,再到Wide&Deep、Deep&Cross、DeepFM、xDeepFM等支持高阶特征交叉的深度模型,进一步演化到DIN、DIEN、DSIN等结合用户行为序列的深度学习模型,一直作为工业界以及学术界研究的热点领域之一,被不断探索和不断创新。但是,position bias的问题却研究甚少。

各大公司现在都在强调「推荐生态」的理念,debias也是构建良好推荐生态中不可或缺的一个关键要素。

ff165845529f24a389e614f6ba26df90.png

经过随机shuffle之后,按理说用户对各个位置的平均点击率应该是一样的,但实际上用户还是对top item的点击率高,这说明position bias确实存在

笔者将介绍一下自己在实习时使用的几种业界常用的降低position bias的方法。当时在做文献调研的时候发现了很多用统计方法来解决position bias,但数学公式太过复杂而我数学很差:( 公司也招了些学统计的人来做一块。这篇不会涉及复杂的数学公式。

2. 解决方法

2.1 position作为特征

该方法出自Airbnb的一篇经典的搜索文章 Improving Deep Learning for Airbnb Search.

给定一个用户 ,以及一个query 和一个list ,以及list中的每个位置 。用户预订的概率是:

其中前半部分是这个item被用户预订的概率,后半部分是item在位置k被用户看到的概率。二者相乘就是一个item在位置k上被预订的概率。理想情况下我们只要关注于前半部分然后对list进行排序就OK。

Airbnb在训练时加入位置信息,但是在预估的时候将特征置为0。但是发现模型的NDCG跌了1.3%。文章指出,可能是训练的时候相关性的计算过度依赖位置信息,但是在测试的时候,这个位置信息就没有了,所以导致效果变差。

为了减少相关性计算对position feature 的依赖,文章采用了训练阶段对position feature 进行dropout,这样就能够减少模型对位置特征的依赖。

通过实验文章选择了0.15的dropout比例,对线上的结果有0.7%的下单率的提升。经过多次迭代之后,订单收入涨了1.8%。需要注意的是位置特征不能与其他特征做交叉。

2.2 position作为模块

(a) shallow tower

这种方法出自Youtube多目标排序论文 Recommending What Video to Watch Next: A Multitask Ranking System。

如果不去除position bias,那么用户对一个item的ctr是由user engagement(用户偏好)和position bias共同造成的。如果能够将user engagement和position bias独立开来,将有助于提升模型的推荐质量。

本文提出的做法类似wide&deep,即添加一个浅层网络(shallow tower),输入position feature, device info(原因是在不同的设备上会观察到不同的位置偏差), 以及其他能够带来位置偏差的特征,输出为position bias分量。这就将user engagement和position bias 独立开来了。

6638ee4bd90bbabe13ba4cc62b3799b0.png

在主模型的输出层的sigmoid激活函数之前,加上浅层网络的bias分量。训练的时候,随机丢掉10%的位置特征,防止模型过度依赖位置特征。预测的时候,直接丢掉浅层网络。

(b) PAL

出自华为Recsys 2019. PAL: a position-bias aware learning framework for CTR prediction in live recommender systems

作者分析到,用户点击广告的概率由两部分组成:

  • 广告被用户看到的概率

  • 用户看到广告后,点击广告的概率

那么可以进一步假设:

  • 用户是否看到广告只跟广告的位置有关系

  • 用户看到广告后,是否点击广告与广告的位置无关

基于该假设,就可以分开建模:

484a9c208df843f73210dcba71aa8d4b.png

其中:ProbSeen部分是预估广告被用户看到的概率,pCTR部分是用户看到广告后,点击广告的概率,然后loss是两者的结合:

线上servering的时候,直接预估pCTR即可(ProbSeen都看作是1). PAL和shallow tower的区别在于PAL是连乘概率,而shallow tower是类似wide&deep的相加。

注记:

其实,PAL的设计和ESMM有异曲同工的地方,都是将事件拆解为两个概率事件的连乘,但是PAL的假设过强,事件的关联性没有ESMM的点击->购买这样的强关联,这是因为:

第一个假设: 广告是否被用户看到只跟广告位置有关,这个假设在广告场景是不合适的。因为他跟广告、以及用户的属性都有关系(广告大图、小图等)。只能说,广告是否被用户看到,广告位置是其中一个因素,打个比方,一个显示页中有大量item,人的习惯可能更会关注头和尾,而快速划过中间的一些位置。因此可以对第一个模型更精细建模解决(论文中这个模型只用了position信息)

第二个假设: 用户看到广告后, 是否点击与广告位置无关。这个实际上可能是有关的。比如在一个页面,用户同时_看到了_ 位置1的广告和位置3的广告,但用户点击位置1的广告的概率更大。这其实还是position bias本身要解决的问题。

3. 实际应用结果

我们在不同场景下对这三种方法都有尝试。在我做的用户搜索场景,把position bias去掉之后,离线指标(auc)不可避免地会下降。在线上要取得短期指标上的收益也比较困难,因为在bias存在的情况下,一些流行的item会占据大部分流量、消费指标也很好;去掉bias之后,长尾商品得到更多的曝光,但是业务指标(如ctr)可能会下降。但是这样做对长期推荐系统的健康生态会有很大帮助。

4. 其他bias简介

推荐系统的bias是无处不在的,从user、data、model这三个推荐循环生态的角度出发,整体归纳起来大致有以下几个Bias:

  • Position Bias:用户更倾向于和位置靠前的物品进行交互

  • Exposure Bias:带标签的数据都是曝光过的,未曝光的数据无法确定其标签

  • Selection Bias:用户倾向于给自己喜欢或者不喜欢的物品进行打分

  • Conformity Bias:用户打分的分数倾向于和群体观点保持一致

  • Popularity Bias:热门的物品获得了比预期更高的热度,长尾物品得不到足够曝光、马太效应严重

  • Unfairness:因数据不均匀导致对某些弱势群体的推荐结果有偏

这些bias在推荐系统的反馈循环中会不断被加剧,导致推荐生态逐步恶化。具体可以参考我们之前的文章或者原始论文:

d68a58c2993f741d0153022ee11e6503.png

下一篇,我们将介绍美团在KDD cup 2020 Debiasing的解决方案。

参考:

  • https://zhuanlan.zhihu.com/p/342905546

  • https://zhuanlan.zhihu.com/p/420373594

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

14d441859477adbd6eb60ef8fc6cea84.png

END -

f96eeeb7c59ffea3c352b87559672520.png

894f08acce1edc45cc32a642a412a40b.png

KDD 2021 | 推荐系统论文集锦[持续更新]

2021-11-16

41aa975aa91dbb5c532119e56aeafe9c.png

百度 2021 Lic 机器阅读理解比赛有感

2021-11-15

1ca0945a66774cea7fe08ca83e389fc8.png

NLP中的范式迁移

2021-10-18

0ebdc44e1b68ac8f789e295886f6ecf2.png

阿里广告技术最新突破!全链路联动——面向最终目标的全链路一致性建模

2021-09-25

09a73771049147682bc6257504083e85.png

944ca1211fcd046674b0e06ab58e29c2.gif

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 相对位置偏差是指在比较两个或多个对象时,由于它们的位置不同而产生的偏差。这种偏差可能会影响人们对这些对象的评价或决策。例如,在比较两个产品时,如果一个产品在展示时放在更显眼的位置,人们可能会更倾向于选择它,而不是另一个产品。这种偏差在市场营销和广告经常被利用。 ### 回答2: 相对位置偏见是指人们在对事物进行评价时,会受到相对位置的影响而产生偏见。这种偏见源于人们对比和比较的倾向,以及对先前经验的依赖。 相对位置偏见在各个领域都有体现。在商品定价,人们往往会根据相邻商品的价格来评价某个商品的价值。如果一个商品被安排在高价位的商品旁边,人们往往会认为该商品的价格也较高。同样道理可以应用在房产市场,如果一个房子周围的房价普遍较高,那么人们也会认为该房子的价值相对较高。 相对位置偏见还存在于学术评价。例如,在学术界,一个研究成果被发表在知名期刊上会比被发表在相对较低影响力的期刊上更受重视。这是因为人们倾向于将相对位置较高的期刊视为权威,有更高的学术价值。 此外,相对位置偏见还会影响人们的审美观念。在艺术领域,展品被摆放在观众眼睛所能直接看到的位置,会使人们对其产生更正面的评价。同样,在推销产品或者服务时,摆放在眼睛所能直接看到的位置也会增加其吸引力。 相对位置偏见的存在使人们的判断和评价受到一定程度的影响。了解和认识这一偏见有助于我们更客观地对待事物,避免不必要的主观判断。同时,我们也可以利用相对位置偏见来更好地推销产品、增强品牌价值和吸引目标受众。 ### 回答3: 相对定位偏见(relative position bias)是指在人类的思考和决策过程,对于信息或选项在一个序列或集合的相对位置所产生的偏好性倾向。 相对定位偏见是人们在面临多个选择时,往往更倾向于选择出现在序列或集合的前部分或末尾的选项,而忽视间的选项。这个偏见可能是由于人类对于序列的首尾元素有更强的印象或记忆,导致对这些位置上的选项更加关注和偏好。 相对定位偏见在许多领域都有广泛的应用和影响。例如,在市场营销,商品的位置会影响消费者的购买决策。出现在超市货架前部或末尾的商品通常比间位置的商品更容易吸引消费者的注意,从而增加销量。 相对定位偏见还可能存在于信息展示和排列的过程。在新闻报道或调查问卷,布局和顺序的安排可能会对读者或受访者的选择和回答产生影响。出现在前部或末尾的选项可能会被更多人注意和选择,而间的选项容易被忽视或被认为次要。 为了避免相对定位偏见的影响,人们可以采取一些策略。例如,可以在选择之前有意识地检查整个序列或集合,并给予每个选项公平的考虑。此外,在信息或选项的排列上可以采用随机或变换的方式,以消除潜在的位置偏见。 总的来说,相对定位偏见是人类思考和决策过程的一个常见现象,对于选择和评估的结果有着重要的影响。了解和认识这种偏见,有助于我们更客观地进行决策和判断。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值