Collaborative Filtering for Implicit Feedback Datasets结论公式推导

最新推荐文章于 2024-07-09 16:15:46 发布

han1254

最新推荐文章于 2024-07-09 16:15:46 发布

阅读量194

点赞数

分类专栏：推荐系统文章标签：推荐系统推荐算法机器学习论文

本文链接：https://blog.csdn.net/qq_42898299/article/details/125606030

版权

推荐系统专栏收录该内容

16 篇文章 5 订阅

订阅专栏

Collaborative Filtering for Implicit Feedback Datasets^[1]公式推导

精确反馈的模型

$\min\limits_{x^*,y^*}\sum\limits_{r_{u,i} \text{ is known}}(r_{u,i}-x_u^Ty_i)^2+\lambda(\Vert x_u\Vert ^2+\Vert y_i\Vert^2)\tag{1}$

隐式反馈模型

用户 $u$ 对商品 $i$ 的交互量用 $r_{ui}$ 来表示，利用 $p_{ui}$ 表示用户 $u$ 对商品 $i$ 的偏好，通过二元化 $r_{u,i}$ 来获得。

$p_{ui}=\begin{cases}1&r_{ui}>0\\0&r_{ui}=0\end{cases}$

如果用户 $u$ 与商品 $i$ 进行了交互，则可以有一定的概率认为用户 $u$ 喜欢商品 $i$ 。
但是用户没有对某个商品产生正反馈，不一定是不喜欢这个商品。他可能根本就没看到这个商品或者因为价格或者其他限制原因使得他没有点开的意愿或者条件。

此外，用户的正反馈可能也不是因为喜欢，例如，用户可能仅仅因为停留在之前看过的节目的频道就看电视节目。

当 $r_{ui}$ 增长的时候，我们有更坚定的理由去相信用户喜欢这个商品。在此我们引入变量 $c_{ui}$ 来表示用户 $u$ 对商品 $i$ 产生的喜好 $p_{ui}$ 的置信程度。

$c_{ui}=1+\alpha r_{ui}$

$\alpha$ 的初始值设置为40

模型的目标是为每个用户 $u$ 找到可以代表它的向量 $x_u\in \R^f$ ，以及每个商品的代表向量 $y_i\in \R ^f$ ，它们可以通过内积即 $p_{ui}=x_u^Ty_i$ 用来表达用户的喜好。可以称这些向量为用户因子和商品因子，这些向量将用户和商品拉入了一个可以直接比较的隐向量空间。

与传统的精确反馈的区别在于

需要计算不同的置信程度
优化的时候需要考虑所有的 $u, i$ 对

我们需要进行最小化的损失函数为
$\min\limits_{x^*,y^*}\sum\limits_{u,i} c_{ui}(p_{ui}-x_u^Ty_i)^2+\lambda(\Vert x_u\Vert ^2+\Vert y_i\Vert^2)\tag{2}$
由于考虑到矩阵中的所有元素， $m\times n$ 很容易达到几十亿的级别，这样传统的梯度下降就不合适了。因此使用交替最小二乘法。

我们令 $L(x_u,y_i)=\sum\limits_{ui} c_{ui}(p_{ui}-x_u^Ty_i)^2+\lambda(\Vert x_u\Vert ^2+\Vert y_i\Vert^2)$

假设商品矩阵 $Y$ 是确定的，对 $x_u$ 求偏导

$\frac{\partial L}{\partial x_u}=\begin{bmatrix}\frac{\partial L}{\partial x_{u1}}\\\frac{\partial L}{\partial x_{u2}}\\\vdots\\\frac{\partial L}{\partial x_{uf}}\end{bmatrix}=\begin{bmatrix}\sum\limits_{i=1}^n2c_{ui}(p_{u,i}-x_u^Ty_i)(-y_{i1})\\\sum\limits_{i=1}^n2c_{ui}(p_{u,i}-x_u^Ty_i)(-y_{i2})\\\vdots\\\sum\limits_{i=1}^n2c_{ui}(p_{u,i}-x_u^Ty_i)(-y_{if})\end{bmatrix}+\begin{bmatrix}2\lambda x_{u1}\\2\lambda x_{u2}\\\vdots\\2\lambda x_{uf}\end{bmatrix}$

让偏导向量为0向量，也就是最后两个向量之和为0，那么可以将2消除。

$\begin{bmatrix}\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{i1})\\\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{i2})\\\vdots\\\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{if})\end{bmatrix}=\begin{bmatrix}\lambda x_{u1}\\\lambda x_{u2}\\\vdots\\\lambda x_{uf}\end{bmatrix}$

我们来观察左边向量的形式：
设：
$V=\begin{bmatrix}\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{i1})\\\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{i2})\\\vdots\\\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{if})\end{bmatrix}$

设矩阵 $Y_{n\times f}$ ，每一行代表着商品的特征向量， $f$ 为向量空间的维度。也就是说 $Y=\begin{bmatrix}y_1^T\\y_2^T\\\vdots\\y_n^T\end{bmatrix}$
论文中，也提出了 $C_u$ 为一个包含置信度的对角矩阵
$C_u=\begin{bmatrix}c_{u1}\\&c_{u2}\\&&\ddots\\&&&c_{un}\end{bmatrix}$
这里用大写字母表示矩阵，小写字母表示向量，请不要混淆。

$\sum\limits_{i=1}^nc_{ui}(p_{ui}-x_u^Ty_i)(y_{i1})=\begin{bmatrix}c_{u1}(p_{u1}-x_u^Ty_1)\\c_{u2}(p_{u2}-x_u^Ty_2)\\\vdots\\c_{un}(p_{un}-x_u^Ty_n)\end{bmatrix}^T\times \begin{bmatrix}y_{11}\\y_{21}\\\vdots\\y_{n1}\end{bmatrix}\\=(C_u\times(p(u)-Yx_u))^T\times Y_{*,1}\\=Y_{*,1}^T\times (C_u\times(p(u)-Yx_u))$

$V=\begin{bmatrix}Y_{*,1}^T\times (C_u\times(p(u)-Yx_u))\\Y_{*,2}^T\times (C_u\times(p(u)-Yx_u))\\\vdots\\Y_{*,n}^T\times (C_u\times(p(u)-Yx_u))\end{bmatrix}=\begin{bmatrix}Y_{*,1}^T\\Y_{*,2}^T\\\vdots\\Y_{*,n}^T\end{bmatrix}\times (C_u\times(p(u)-Yx_u))\\=Y^T\times (C_u\times(p(u)-Yx_u))=\lambda x_u$

可得：

$Y^TC_up(u)=(\lambda I+Y^TC_uY)x_u\iff x_u=(\lambda I+Y^TC_uY)^{-1}Y^TC_up(u)$

[1] Hu Y, Koren Y, Volinsky C. Collaborative filtering for implicit feedback datasets[C]//2008 Eighth IEEE international conference on data mining. Ieee, 2008: 263-272.

han1254

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Collaborative Filtering for Implicit Feedback Datasets结论公式推导

精确反馈的假设并不总是可行的。一个用户可能选择不去对不喜欢的物品做出反映，这使得这样的一个交互条目缺失。或者数据并不能第一时间就捕获到用户的确定的偏好。例如一个点击数据流集合只能显示出用户浏览物品的频繁程度，却不能等价地说明用户喜欢这个商品。事实上用户在第一次浏览商品之前不可能会表示出对商品的反感。或者用户已经在别的地方见到过这个商品并且选择再也不看了，因为他对这个商品不感兴趣。这些情况下用户都不喜欢这个商品，但是没有方法可以仅凭点击流辨别出用户的真实喜好。这就是为什么隐式反馈的方法出现。...
复制链接

扫一扫