FM算法公式推导

一.提出背景设 xix_{i}xi​ 为特征,yyy 为预测值,假设我们用最简单的线性拟合来预测 yyy 值:y=w0+∑i=1nwixi{y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}y=w0​+i=1∑n​wi​xi​实际中可能 xix_{i}xi​,xjx_{j}xj​ 同时为1时可能是一个很有用的特征,这种组合特征是 xix_{i}xi​ 和 xjx_{j}xj​...
摘要由CSDN通过智能技术生成
一.提出背景

x i x_{i} xi 为特征, y y y 为预测值,假设我们用最简单的线性拟合来预测 y y y 值: y = w 0 + ∑ i = 1 n w i x i {y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i} y=w0+i=1nwixi实际中可能 x i x_{i} xi x j x_{j} xj 同时为1时可能是一个很有用的特征,这种组合特征是 x i x_{i} xi x j x_{j} xj 的线性组合所无法表示的。这样一来乘积 x i x j x_{i}x_{j} xixj 就成一个新的特征。为了不错过任何一个这种可能有用的组合特征,我们穷举所有的 i i i j j j组合: y = w 0 + ∑ i = 1 n w i x i + ∑ i n − 1 ∑ j = i + 1 n w i j x i x j {y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i}^{n-1} \sum_{j=i+1}^{n} w_{i j} x_{i} x_{j} y=w0+i=1nwixi+in1j=i+1nwijxixj这只是组合了2个特征,同样道理我们可以组合任意三个特征、四个特征,随着阶数的提高,样本会显得非常稀疏,而且额外引入的参数呈指数增长。

FM总结:
1.二次回归
2.二次项系数矩阵分解
3.统一了各种矩阵分解模型

二.Factorization Machines

由于多了二次项系数 w i j w_{ij} wij,我们额外引入 n 2 2 \frac{n^{2}}{2} 2n2 个参数需要训练。有没有什么办法可以减少参数?再来观察二次项系数矩阵 W n × n W_{n×n} Wn×n,它是对称的方阵 w i j w_{ij} wij = w j i w_{ji} wji,同时它是稀疏的,因为绝大部分的组合特征都是无用的,所以其系数应该为0。可以对 W n × n W_{n×n} Wn×n 进行矩阵分解 W n × n W_{n×n} Wn×n = V n × k V_{n×k} Vn×k V n × k T V_{n×k}^{T} Vn×kT,即 w i , j = < V i , V j > w_{i,j} = <V_{i}, V_{j}> wi,j=<Vi,Vj>。其中 k ≪ n k≪n kn,本来需要训练的 n × n n×n n×n 个参数,现在只需要训练 n × k n×k n×k 个: y = w 0 + ∑ i = 1 n w i x i + ∑ i n − 1 ∑ j = i + 1 n < V i , V j > x i x j {y}=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i}^{n-1} \sum_{j=i+1}^{n}<V_{i}, V_{j}>x_{i} x_{j} y=w0+

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值