推荐系统Deconfounded Recommendation for Alleviating Bias Amplification因果论文笔记

Deconfounded Recommendation for Alleviating Bias Amplification

推荐系统中通常用于学习的数据是不平衡的,传统方法会忽略偏差放大

方法

基本思路

用因果推断的方法,分析得到user-item的不平衡历史数据会影响用户表征和预测分数
D为历史点击数据分布,U为用户表征,M为用户在item分组上的表征,I为item表征,Y为预测分数
在这里插入图片描述

历史点击数据对用户表征和预测分数都有影响
在这里插入图片描述

D是U->M的混杂因子,后门调整,干预U使U和D独立
在这里插入图片描述

原来的du变成了d,现在依赖的是d的先验分布不再是u的条件分布,因此对用户u推荐item的时候,不会受到du中u用户点击较高的item的影响,这就缓解了数据偏差造成的问题

实现

后门调整
(2c)需要知道D的分布才能进行计算,但理论上D应该是无限大的,只能通过估计得到2c的近似值
在训练数据中,用D~表示对用户在item组上的历史数据的分布来近似D
在这里插入图片描述

M函数表示分组级别的用户表征,表示用户在不同item组上的偏好
在这里插入图片描述

推理策略

一些用户本身就是有偏的,用KL散度来判断用户是否兴趣多变,容易改变兴趣的就容易受到影响
将原有的用户u的序列分为两段序列,然后计算这两段序列的对称KL散度,值越大越容易改变兴趣,需要后门调整
在这里插入图片描述

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值