模型理解--对FM模型核心思想的理解

最新推荐文章于 2024-07-17 23:24:38 发布

K_Snail

最新推荐文章于 2024-07-17 23:24:38 发布

阅读量288

点赞数

分类专栏：推荐系统算法文章标签：算法

本文链接：https://blog.csdn.net/l1l1l1l/article/details/103529195

版权

推荐系统算法专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在《深入FFM原理与实践》中提到：“所有二次项参数 $w_{ij}$ 可以组成一个对称阵 $W$ ，那么这个矩阵就可以分解为 $W=V^TV$ ， $V$ 的第 $j$ 列便是第 $j$ 维特征的隐向量。换句话说，每个参数 $w_{ij}=\left \langle v_i,v_j \right \rangle$ ，这就是FM的核心思想。”
在POLY2模型中等式为： $\hat{y}(x)=w_0+\sum_{i=1}^nw_ix_i+\sum_{i=1}^n{\sum_{j=i+1}^n{w_{i,j}x_ix_j}}$ 在梯度下降时，偏导求解结果如下：
$\frac{\partial }{\partial \theta}\hat{y}(x)=\begin{cases} 1 &{if\;\theta\;is\;w_0} \\ x_i &{if\;\theta\;is\;w_i} \\ x_iy_i &{if\;\theta\;is\;w_{ij}}\\ \end{cases}$ 而在FM模型中等式为： $\hat{y}(x)=w_0+\sum_{i=1}^nw_ix_i+\sum_{i=1}^n{\sum_{j=i+1}^n{{\left \langle v_i,v_j \right \rangle}x_ix_j}}$ 偏导结果为：
$\frac{\partial }{\partial \theta}\hat{y}(x)=\begin{cases} 1 &{if\;\theta\;is\;w_0} \\ x_i &{if\;\theta\;is\;w_i} \\ x_i\sum_{j=1}^nv_{j,f}x_j-v_{i,f}x_i^2 &{if\;\theta\;is\;v_{i,f}}\\ \end{cases}$ 于是便会发现在POLY2模型中，如果训练数据过于稀疏，导致 $x_iy_i=0$ 的情况大量出现，那么在求解的时候 $w_{ij}$ 也会大量出现0，也就是虽然引进两两组合的特征，但是训练效果不好；但是在FM模型中则不会出现这个问题，FM能够抓住变量间的相互作用，并且时间复杂度为 $O (k n)$ 。

K_Snail

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
模型理解--对FM模型核心思想的理解

在《深入FFM原理与实践》中提到：“所有二次项参数 wijw_{ij}wij 可以组成一个对称阵 WWW，那么这个矩阵就可以分解为W=VTVW=V^TVW=VTV，VVV 的第 jjj 列便是第 jjj 维特征的隐向量。换句话说，每个参数 wij=⟨vi,vj⟩w_{ij}=\left \langle v_i,v_j \right \ranglewij=⟨vi,vj⟩，这就是FM的核心...
复制链接

扫一扫