[推荐系统] 手撕FM模型

最新推荐文章于 2024-07-18 23:59:01 发布

手撕机

最新推荐文章于 2024-07-18 23:59:01 发布

阅读量157

点赞数

分类专栏：推荐系统文章标签：机器学习推荐算法人工智能 FM模型

原创文章，未经授权请勿转载。

本文链接：https://blog.csdn.net/guolindonggld/article/details/119340227

版权

推荐系统专栏收录该内容

4 篇文章 0 订阅

订阅专栏

基本形式

FM模型在线性模型的基础上，增加了一个二次项：

$w_0 + \sum^{n}_{i=1} w_i x_i + \sum^{n-1}_{i=1} \sum^{n}_{j=i+1} w_{ij} x_i x_j$

$w_0$ 是常数项，这里有1个参数需要训练；

$\sum^{n}_{i=1} w_i x_i$ 是常见的一次线性模型，这里有n个 $w_i$ 需要训练；

$\sum^{n-1}_{i=1} \sum^{n}_{j=i+1} w_{ij} x_i x_j$ 也就是n个特征之间两两组合，所以这里共有 $\frac{n\times(n-1)}{2}$ 个 $w_{ij}$ 需要训练。

总共有 $1+n+\frac{n\times(n-1)}{2}$ 个参数。

优化改进

存在问题：参数 $w_{ij}$ 学习困难， $\frac{\partial L}{\partial w_{ij}} = x_i x_j$ ，由于特征稀疏， $x_i$ 和 $x_j$ 同时非0的情况很少，所以参数 $w_{ij}$ 很难得到更新。

改进方法：将 $w_{ij}$ 表示成两个向量的内积，也就是：
$w_{ij} = <v_i, v_j>$

对二次项进行变形化简：

$\begin{aligned} \sum^{n-1}_{i=1} \sum^{n}_{j=i+1} w_{ij} x_i x_j & = \sum^{n-1}_{i=1} \sum^{n}_{j=i+1} <v_i, v_j> x_i x_j \\ & = \frac{1}{2}( \sum^{n}_{i=1} \sum^{n}_{j=1} <v_i,v_j> x_i x_j - \sum^{n}_{i=1} <v_i, v_i> x_i x_i) \\ &= \frac{1}{2} ( \sum^{n}_{i=1} \sum^{n}_{j=1} \sum^{k}_{f=1} v_{i,f} v_{j,f} x_i x_j - \sum^{n}_{i=1} \sum^{k}_{f=1} v_{i,f} v_{i,f} x_i x_i ) \\ &= \frac{1}{2} \sum_{f=1}^{k} \left[ (\sum_{i=1}^{n} v_{i,f} x_i) \cdot (\sum_{j=1}^{n} v_{j,f} x_j) - \sum_{i=1}^{n} v_{i,f}^2 x_i^2 \right] \\ &= \frac{1}{2} \sum_{f=1}^{k} \left[ (\sum_{i=1}^{n} v_{i,f} x_i)^2 - \sum_{i=1}^{n} v_{i,f}^2 x_i^2 \ \right] \end{aligned}$

所以最终模型的假设函数是：
$w_0 + \sum^{n}_{i=1} w_i x_i + \frac{1}{2} \sum_{f=1}^{k} \left[ (\sum_{i=1}^{n} v_{i,f} x_i)^2 - \sum_{i=1}^{n} v_{i,f}^2 x_i^2 \ \right]$
这里需要训练的参数有 $1 + n + k n$ 个。

损失函数

假设标签值取值范围{-1,1}，则损失函数定义为：
$\sum_{i=1}^{m} ln \sigma (y^{(i)} \cdot \hat{y}^{(i)})$
其中 $\sigma(y)=\frac{1}{1+e^{-y}}$

求梯度

$\begin{aligned} \frac{\partial L}{\partial \theta} &= \frac{\partial L}{\partial y} \frac{\partial y}{ \partial \theta} \\ &= ? \end{aligned}$

首先看 $\frac{\partial L}{ \partial y}$ ：

也就是类似对 $y=ln(\frac{1}{1+e^{-ax}})$ 求导数。

$\begin{aligned} \frac{\partial L}{\partial \theta} &= \frac{\partial L}{\partial y} \frac{\partial y}{ \partial \theta} \\ &= - (1-\frac{1}{1+e^{-y^{(i)}\hat{y}^{(i)} } } ) \cdot y^{(i)} \cdot \frac{\partial y}{ \partial \theta} \\ \end{aligned}$

然后看 $\frac{\partial y}{ \partial \theta }$ ：

$f(x)=\left\{ \begin{aligned} & 1 ,& & if \ \theta=w_0 \\ & x_i ,& & if \ \theta=w_i \\ & x_i \sum_{j=1}^{n} v_{j,f}x_j - v_{i,f}x_i^2 ,& & if \ \theta=v_{i,f} \end{aligned} \right.$
其中二次项的求导比较难理解：
$\begin{aligned} & \frac{\partial( \frac{1}{2} \sum_{f=1}^{k} \left[ (\sum_{i=1}^{n} v_{i,f} x_i)^2 - \sum_{i=1}^{n} v_{i,f}^2 x_i^2 \ \right]) }{\partial(v_{i,f})} \\ &= \frac{1}{2} \left[ 2 \cdot (\sum_{i=1}^{n} v_{i,f} x_j ) \cdot x_i - 2 \cdot x_i^2 \cdot v_{i,f} \right]\\ &= (\sum_{j=1}^{n} v_{j,f} x_j ) \cdot x_i - v_{i,f} x_i^2 \\ \end{aligned}$
第一个等号；第二个等号，因为求导跟 $i$ 无关，所以换个符号以示区分。

参考：
[1] FM因子分解机的原理、公式推导、Python实现和应用
[2] DeepFM算法解析及Python实现
[3] FM因式分解(原理+代码)

手撕机

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
[推荐系统] 手撕FM模型

基本形式FM模型在线性模型的基础上，增加了一个二次项：y=w0+∑i=1nwixi+∑i=1n−1∑j=i+1nwijxixjy = w_0 + \sum^{n}_{i=1} w_i x_i + \sum^{n-1}_{i=1} \sum^{n}_{j=i+1} w_{ij} x_i x_jy=w0+i=1∑nwixi+i=1∑n−1j=i+1∑nwijxixjw0w_0w0 是常数项，这里有1个参数需要训练；∑i=1nwixi\sum^{n}_{i=1} w_i x_i∑i
复制链接

扫一扫