推荐系统笔记——FM 模型

最新推荐文章于 2024-08-01 10:42:31 发布

prinf("Hello World")

最新推荐文章于 2024-08-01 10:42:31 发布

阅读量358

点赞数

文章标签：推荐系统机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39484341/article/details/107695064

版权

本文是关于FM（Factorization Machine）模型在推荐系统中的学习笔记。线性模型通过加入交互项提升表达能力，但面临计算复杂度和稀疏数据问题。FM模型通过引入隐向量解决这些问题，其计算复杂度可优化到O(kn)，并且能利用更多特征信息，优于MF模型。FM模型在推荐系统中有较高的计算效率和泛化能力。

摘要由CSDN通过智能技术生成

文章目录

推荐系统笔记——FM 模型
References

推荐系统笔记——FM 模型

楼主小白一枚还在学习，下面仅是学习笔记，并非教程，文章中如果有问题烦请指正，欢迎一起交流学习。

线性模型及其改进

传统的推荐系统中，比较常用的模型是 LR 模型。LR 模型本质上来说是线性模型，线性模型可以表示为下面的形式：

$\hat{y} = w_0 + \sum_{i=1}^{n} w_i x_{i}$

线性模型的优点是速度性，并且可解释性强。缺点是表达能力弱。

为了提高普通线性模型的表达能力，可以在线性模型中加入交互项：

$\hat{y} = w_0 + \sum_{i=1}^{n} w_i x_i + \sum_{i=1}^{n} \sum_{j=i+1}^{n} w_{i,j} x_i x_j \quad\quad (1)$

注意，这里的交互项不包含 $x_i^2$ 这样的项。

上面的模型，实际上等价于 SVM 在 kernel 为多项式核的情况，因此上面的模型也在原论文中被称为 SVM 模型。也有人称这个模型为 LR 模型。

此模型的矩阵形式为

$\hat{y} = w_0 + x^T w + x^T W x$

由于不包含 $x_i^2$ ，因此 $W$ 的对角线为0，并且是对称矩阵（至于为什么对称，这应该是线性代数的知识吧？）。

SVM模型的缺点

加入交互项之后，虽然模型的表达能力增强，但是有下面的两个问题：

计算复杂度比较高。一共有 n(n-1) / 2 个参数
在数据很稀疏的条件下表现并不好。考虑是对类别变量进行 one-hot encoding 的情况，如果有两个类别在样本中没有同时出现过，那么 $x_i x_j$ 在样本中总是为 0，因此 $\frac{\partial \hat{y}}{\partial w_{i,j}} \equiv 0$ ， $w_{i,j}$ 完全无法更新。

FM 模型

由于上述的两个问题的存在，因此进行下面的改进，

假设第 $i$ 个特征可以表示为一个 k 维的向量 $v_i \in \mathbb{R}^k$ 。 $k$ 是隐向量的长度，是一个需要提前给定的超参数。

而 $w_{i,j}$ 是度量第 i 个特征和第 j 个特征的交互作用的参数。令 $w_{i,j} = \left\langle v_i, v_j \right\rangle$ ，因此 $(1)$ 式就变成了

$\hat{y} = w_{0} + \sum_{i=1}^{n} w_{i} x_{i} + \sum_{i=1}^{n} \sum_{j=i+1}^{n}\left\langle v_{i}, v_{j}\right\rangle x_{i} x_{j} \quad \quad ( 2 )$

此时模型的参数为

常数项 $w_0$
线性部分的参数，合写成一个向量 $w_1, \ldots, w_n$
交互项部分的参数 $v_1, \ldots, v_n$ ，将其按行排列得到一个矩阵 $\begin{pmatrix} v_1^T\\ \vdots\\ v_n^T \end{pmatrix} \in R^{n \times k}$

这个 $V$ 模型看起来貌似比较突兀，其实如果从矩阵的角度来看会比较简单。SVM 模型的问题是 $W$ 的维度过大，是 $O(n^2)$ 量级的，并且在许多情况下是稀疏的。因此我们可以假设，

最低0.47元/天解锁文章

prinf("Hello World")

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。