推荐系统中的偏差

赵小丽-programer

已于 2022-05-16 13:09:00 修改

阅读量1.8k

点赞数

文章标签：机器学习深度学习

于 2022-05-16 13:07:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lili555521/article/details/124795810

版权

本文探讨推荐系统中的偏差问题，如曝光偏差和选择偏差，以及如何通过IPW（逆概率加权）、DICE（区分兴趣和偏差建模）和因果推断等方法进行校正。IPW通过曝光量调整权重，DICE则尝试将偏差和用户兴趣分开建模，而因果推断利用因果图来消除因曝光导致的偏差。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

推荐系统消偏

推荐系统中的偏差
- IPW ——逆概率加权
- - DICE ——区分兴趣和偏差建模
  - 因果推断

推荐系统中的偏差

预估问题我们一般会注重两种误差，偏差和方差，
方差与模型泛化能力有关：通常关注模型的复杂度与是否过拟合；偏差则表现为与真实模型的预估差距的差异，与以即模型的拟合能力有关。
一般来说，简单的模型会有一个较大的偏差和较小的方差，复杂的模型偏差较小方差较大。
除模型的复杂度外，训练数据是否与真实数据分布的差异大小这一点也必须考虑。
我们来看一下数据问题造成的偏差：曝光偏差、选择偏差
数据的真实分布，推荐系统线上预估面临的是真实的分布，模型训练时采用观测到的样本，本身就包括了选择偏差、曝光偏差。这种偏差是系统性的，具备危害。
解决这些偏差有一些方法，在这里写我了解到的3种，IPW （逆概率加权）、DICE(区分兴趣和偏差建模)、因果推断（根据因果关系，使用do算子建模）

IPW ——逆概率加权

因为选择偏差偏差，训练的数据分布和真实分布存在差异。方法：根据曝光量和曝光量逆向调整权重，简单粗暴，符合逻辑，训练起来不好收敛。
在这里插入图片描述

DICE ——区分兴趣和偏差建模

这个方法挺不错的，是一个框架类的去偏方法，将偏差和用户兴趣分开建模，难点是，用户真正兴趣的训练集要怎么构建的问题。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。