逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用

最新推荐文章于 2022-10-12 11:21:26 发布

白水baishui

最新推荐文章于 2022-10-12 11:21:26 发布

阅读量3.8k

点赞数 23

分类专栏：推荐系统文章标签： IPS 逆向倾向评分推荐系统去偏 MF

本文链接：https://blog.csdn.net/baishuiniyaonulia/article/details/124494366

版权

推荐系统专栏收录该内容

19 篇文章 45 订阅

订阅专栏

当历史交互数据为MCAR(Missing Completely At Random，完全随机缺失)时，评级预测损失函数可以定义为：
$\mathcal{Loss}_{Naive}=\frac{1}{|\{(u,i):o_{u,i}=1\}|}\sum_{(u,i):o_{u,i}=1}\delta_{u,i}(Y,\hat{Y})$ 其中， $\hat{Y}$ 表示预测的评级； $Y$ 表示 $u$ 对 $i$ 的实际评级； $o_{u,i}=1$ 表示 $u$ 对 $i$ 有评级； ${(u,i):o_{u,i}=1\}|$ 表示所有被浏览项目的数量； $\delta_{u,i}(Y,\hat{Y})$ 表示 $Y$ 与 $\hat{Y}$ 之间匹配程度的度量，可以定义为： $\delta^{MSE}_{u,i}(Y,\hat{Y})=(y_{u,i}-\hat{y}_{u,i})^2$ $\delta^{MAE}_{u,i}(Y,\hat{Y})=|y_{u,i}-\hat{y}_{u,i}|$

但是历史记录往往是MNAR(Missing Not At Random，非随机缺失)的，那么整体评级预测损失就是有偏的： $\begin{aligned} \mathbb{E}[\mathcal{Loss}_{Naive}] & = \frac{1}{\sum^{N}_{u=1}\sum^{M}_{i=1}p(o_{u,i}=1)}\sum^{N}_{u=1}\sum^{M}_{i=1}p(o_{u,i}=1)\delta_{u,i}(Y,\hat{Y}) \\ & \neq \frac{1}{N\cdot M}\sum^{N}_{u=1}\sum^{M}_{i=1}\delta_{u,i}(Y,\hat{Y}) \\ \end{aligned}$ 其中， $p(o_{u,i}=1)$ 是指 $u$ 浏览 $i$ 的概率； $\frac{1}{N\cdot M}\sum^{N}_{u=1}\sum^{M}_{i=1}\delta_{u,i}(Y,\hat{Y})$ 指的是所有 $u$ 对所有 $i$ 平均评分损失，它是一种算术平均； $\mathbb{E}[\mathcal{Loss}_{Naive}]$ 指的是被浏览的 $i$ 的期望评分损失，它是一种加权平均。

加权平均是有偏的，它的偏差就来自于给不同自变量分配的权值，在推荐任务中，这个权值指的就是物品被观测（浏览）到的概率。一种减轻MNAR反馈中偏差的影响的IPS估计法这样定义评级预测损失函数： $\mathcal{Loss}_{IPS}=\frac{1}{N\cdot M}\sum_{(u,i):o_{u,i}=1}\frac{\delta(Y,\hat{Y})}{p(o_{u,i}=1)}$ 该公式的思想是消除权值（浏览概率）的影响，于是就有了无偏估计的公式： $\begin{aligned} \mathbb{E}[\mathcal{Loss}_{IPS}] & = \frac{1}{N\cdot M}\sum^{N}_{u=1}\sum^{M}_{i=1}\frac{p(o_{u,i}=1)\delta_{u,i}(Y,\hat{Y})}{p(o_{u,i}=1)} \\ & = \frac{1}{N\cdot M}\sum^{N}_{u=1}\sum^{M}_{i=1}\delta_{u,i}(Y,\hat{Y}) \\ \end{aligned}$ 注意到， $\mathcal{Loss}_{IPS}$ 与 $\mathcal{Loss}_{Naive}$ 的区别不仅仅在于消除权值，而且 $\mathcal{Loss}_{IPS}$ 是整体的损失，而 $\mathcal{Loss}_{Naive}$ 是浏览过的项目的损失。

所以要使这个公式真正起作用，必须知道全部项目的 $p(o_{u,i}=1)$ 的具体值。在实际的应用中，历史交互数据中记录了部分评级数据，因此可以利用某种拟合方法来推断 $p(o_{u,i}=1)$ 的模型，例如：

通过朴素贝叶斯进行倾向估计
$p(o_{u,i}=1|y_{u,i}=r)=\frac{p(y=r|o=1)p(o=1)}{p(y=r)}$ 其中 $p (y = r ∣ o = 1)$ 和 $p (o = 1)$ 是通过MNAR数据集中的历史交互数据统计出来的。 $p (y = r)$ 是从一个MCAR数据集获取的，这样就能计算出MCAR的 $p(o_{(u,i)}=1| y_{(u,i)}=r)$ 。这种方法必须要确保有部分可用的MCAR数据。并且它只能拟合出被评分过项目的浏览概率。
通过逻辑回归进行倾向估计
$p(o_{u,i}|X,\phi)=\sigma(\omega^TX_{u,i}+\beta_i+\gamma_u)$ 其中， $\sigma(\cdot)$ 是Sigmoid函数，用于将数值归一化； $X_{u,i}$ 是用户-项目对的特征； $\phi$ 代表参数集合，包括： $\omega^T$ 是权重参数、 $\beta_i$ 是项目的偏置项参数、 $\gamma_u$ 是和用户的偏置项参数。这种方法不需要实现筛选出一个MCAR数据集，且可以拟合所有项目的浏览概率。

获得了权重 $p(o_{u,i}=1)$ 后就可以预测对应的无偏评级了。需要说明的是，通过朴素贝叶斯进行倾向估计是相对简单易实现的方法，但这种方法得到的结果是没法直接用来产生推荐的，但是下一步已经很好继续下去了。例如可以使用矩阵分解（matrix factorization，MF）来预测其余项目的评分。

在这里插入图片描述

我随手找了一张矩阵分解方法的示意图，可以认为，拟合出权重 $p(o_{u,i}=1)$ 的项目的无偏评级就是上表中红色的数值，未拟合出权重的项目评级就是上表中的问号。矩阵分解通过下面的公式将用户-物品交互矩阵分解成两个隐特征矩阵： $\hat{y}_{u,i}=\pmb{p}_u^T\pmb{q}_i+a_u+b_i+c$ 其中 $\pmb{p}_u$ 是用户的隐特征矩阵； $\pmb{q}_i$ 是项目的隐特征矩阵； $a_u$ 、 $b_i$ 、 $c$ 分别是用户、项目和全局偏置项。那么此时，矩阵分解的损失函数就表达为： $\argmin_{\pmb{P},\pmb{Q},\pmb{A}}\biggl(\sum_{(u,i):o_{u,i}=1}\frac{\delta(Y,\hat{Y})}{p(o_{u,i}=1)}+\lambda(\Vert \pmb{P}\Vert^2_F+\Vert \pmb{Q}\Vert^2_F)\biggr)$ 其中， $\sum_{(u,i):o_{u,i}=1}\frac{\delta(Y,\hat{Y})}{p(o_{u,i}=1)}$ 指的是无偏的预测评级与真实评级之间的损失， $\lambda(\Vert \pmb{P}\Vert^2_F+\Vert \pmb{Q}\Vert^2_F)$ 是为了防止过拟合加入的正则化项。优化的参数 $\pmb{P},\pmb{Q},\pmb{A}$ 分别代表用户的隐特征矩阵、项目的隐特征矩阵和偏置项，最终的预测评级就表示为： $\hat{Y}=\pmb{P}^T\pmb{Q}+\pmb{A}$ 这时候，之前未拟合出权重的项目评级也可以通过公式 $\hat{Y}=\pmb{P}^T\pmb{Q}+\pmb{A}$ 计算得到了。

白水baishui

关注

23
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
逆向倾向评分 (Inverse Propensity Scoring, IPS) 原理解析与MF算法的结合使用

当历史交互数据为MCAR(Missing Completely At Random，完全随机缺失)时，评级预测损失函数可以定义为：LossNaive=1∣{(u,i):ou,i=1}∣∑(u,i):ou,i=1δu,i(Y,Y^)\mathcal{Loss}_{Naive}=\frac{1}{|\{(u,i):o_{u,i}=1\}|}\sum_{(u,i):o_{u,i}=1}\delta_{u,i}(Y,\hat{Y})LossNaive=∣{(u,i):ou,i=1}∣1(u,i):ou,i
复制链接

扫一扫