FM算法公式推导

最新推荐文章于 2024-04-23 17:36:06 发布

菜鸡的鼻祖

最新推荐文章于 2024-04-23 17:36:06 发布

阅读量3.1k

点赞数 4

分类专栏：推荐系统

本文链接：https://blog.csdn.net/qq_32486393/article/details/103498519

版权

一.提出背景设 xix_{i}xi 为特征，yyy 为预测值，假设我们用最简单的线性拟合来预测 yyy 值：y=w0+∑i=1nwixi{y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}y=w0+i=1∑nwixi实际中可能 xix_{i}xi，xjx_{j}xj 同时为1时可能是一个很有用的特征，这种组合特征是 xix_{i}xi 和 xjx_{j}xj...

摘要由CSDN通过智能技术生成

一.提出背景

设 $x_{i}$ 为特征， $y$ 为预测值，假设我们用最简单的线性拟合来预测 $y$ 值： ${y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}$ 实际中可能 $x_{i}$ ， $x_{j}$ 同时为1时可能是一个很有用的特征，这种组合特征是 $x_{i}$ 和 $x_{j}$ 的线性组合所无法表示的。这样一来乘积 $x_{i}x_{j}$ 就成一个新的特征。为了不错过任何一个这种可能有用的组合特征，我们穷举所有的 $i$ ， $j$ 组合: ${y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i}^{n-1} \sum_{j=i+1}^{n} w_{i j} x_{i} x_{j}$ 这只是组合了2个特征，同样道理我们可以组合任意三个特征、四个特征，随着阶数的提高，样本会显得非常稀疏，而且额外引入的参数呈指数增长。

FM总结：
1.二次回归
2.二次项系数矩阵分解
3.统一了各种矩阵分解模型

二.Factorization Machines

由于多了二次项系数 $w_{ij}$ ，我们额外引入 $\frac{n^{2}}{2}$ 个参数需要训练。有没有什么办法可以减少参数？再来观察二次项系数矩阵 $W_{n×n}$ ，它是对称的方阵 $w_{ij}$ = $w_{ji}$ ，同时它是稀疏的，因为绝大部分的组合特征都是无用的，所以其系数应该为0。可以对 $W_{n×n}$ 进行矩阵分解 $W_{n×n}$ = $V_{n×k}$ $V_{n×k}^{T}$ ，即 $w_{i,j} = <V_{i}, V_{j}>$ 。其中 $k ≪ n$ ，本来需要训练的 $n \times n$ 个参数，现在只需要训练 $n \times k$ 个： ${y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i}^{n-1} \sum_{j=i+1}^{n}<V_{i}, V_{j}>x_{i} x_{j}$

最低0.47元/天解锁文章

菜鸡的鼻祖

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
FM算法公式推导

一.提出背景设 xix_{i}xi 为特征，yyy 为预测值，假设我们用最简单的线性拟合来预测 yyy 值：y=w0+∑i=1nwixi{y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}y=w0+i=1∑nwixi实际中可能 xix_{i}xi，xjx_{j}xj 同时为1时可能是一个很有用的特征，这种组合特征是 xix_{i}xi 和 xjx_{j}xj...
复制链接

扫一扫