LTR问题 position debias方法

最新推荐文章于 2021-12-10 11:05:00 发布

JerryLu-CN

最新推荐文章于 2021-12-10 11:05:00 发布

阅读量1k

点赞数

分类专栏：算法文章标签：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jerry_Lu_ruc/article/details/107983061

版权

LTR（Learning to Rank）中存在位置偏倚问题，即用户倾向于点击靠前的item。解决方法包括样本安排技巧和特征&模型设计：如正样本后排除样本、部分流量随机排序、位置信息作为特征、点击模型校准以及YouTube提出的独立shallow tower模型等。这些方法旨在减少训练数据的偏差并提高排序模型的准确性。

摘要由CSDN通过智能技术生成

LTR中的一个常见问题就是position debias，在面试诸如推荐、搜索这样的职位的时候很有可能被问到。
所谓position bias就是指，当给用户展现搜索和推荐结果时，用户倾向于点击第一个item的这个行为里面，既有item的质量的影响，还有item排在第一个这个事件本身的影响。所以直接从原始log的数据中学习排序模型的学到的结果是有偏的。那么解决这种bias的方法主要有一下几种：

1、样本安排的trick：

a. 正样本后的样本都不算到训练样本中，如下图所示。这样就不会计算正样本后的样本，因为这些样本很可能没有被看到
在这里插入图片描述
（这个方法的缺点是用户点击第一个展示就不会产生样本，那么每次训练总是倾向于修改之前的结果）-> 改进：正样本后算有限个样本。

b. 分一部分流量展示topK随机排序，将这部分无偏集加入训练（但是这个流量小的话数据不多，大的话可能会影响一部分人的体验）

2、特征&模型设计：

a. 将位置信息作为特征加入到模型特征中（缺点是预测时没有位置信息，使用缺失值代替的话就造成了训练和预测的不一致，covariate shift）

b. 点击模型校准：通过各种方法得到用户是否看到了位置K（K越大这个概率越小）的概率，然后用1/P(K)给主模型的训练样本进行加权。可以是对用户历史浏览记录的统计，也可以通过向用户展示一些

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LTR问题 position debias方法

LTR中的一个常见问题就是position debias，在面试诸如推荐、搜索这样的职位的时候很有可能被问到。所谓position bias就是指，当给用户展现搜索和推荐结果时，用户倾向于点击第一个item的这个行为里面，既有item的质量的影响，还有item排在第一个这个事件本身的影响。所以直接从原始log的数据中学习排序模型的学到的结果是有偏的。那么解决这种bias的方法主要有一下几种：1、样本安排的trick：a. 正样本后的样本都不算到训练样本中，如下图所示。这样就不会计算正样本后的样本，因为
复制链接

扫一扫

专栏目录

JerryLu-CN CSDN认证博客专家 CSDN认证企业博客

码龄5年

8: 原创

76万+: 周排名

179万+: 总排名

3万+: 访问

: 等级

393: 积分

8: 粉丝

116: 获赞

15: 评论

193: 收藏

私信

关注

热门文章

分类专栏

AI论文 3篇
算法 8篇

最新评论

深入理解实际场景下 AUC vs F1 的区别——不说废话
m0_73236079: 没有说反，你只需要看：固定TP下的auc的FP越低越好就行了，增加误判集的容量会最直接地地增加惩罚，所以倾向于保守
【转载】Transformer vs CNN vs RNN 时间复杂度比较
TremendousGenious: 每层的复杂度分析有问题啊，原论文中k是指kernel size，不是kernel的数量。还有一点，假设RNN的矩阵为n×n的维度，那么RNN的复杂度中的平方项应该和n相关，怎么会是nd^2呢？不知道是不是我理解的有误，请批评指正。
深入理解实际场景下 AUC vs F1 的区别——不说废话
大佬快带我: 我也觉得楼主说反了，AUC应该是偏激进的，宁错杀不放过，我在异常检测的模型中发现AUC高的模型其Recall都很高
深入理解实际场景下 AUC vs F1 的区别——不说废话
齐天大圣*: 你们都没理解正样本是谁，正样本是感染者，也就是说FP是不感染的，FN才是误判不感染的，所以为什么选择AUC？AUC算的TPR与FPR，宁可算错0也不可算错1的场景
深入理解实际场景下 AUC vs F1 的区别——不说废话
qq_15345641: 感觉楼主说反了, f1考虑了p值是保守型，auc主要考虑recall是激进型

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。