FM:Factorization Machines简介

介绍

FM是联合SVM与因式分解模型的优点所得。在有比较大的数据稀疏情况下,也能从中找出联系。FM可以在线性时间内优化。

优点

  1. 可以在非常稀疏的数据中进行合理的参数估计

  2. FM模型的时间复杂度是线性的

  3. FM是一个通用模型,它可以用于任何特征为实值的情况

特征向量例子

在这里插入图片描述

算法原理

  1. model equation:
    在这里插入图片描述
  2. Expressiveness:

对于一个W总是存在 W = V ⋅ V t W=V·V^t W=VVt,也就说对于任何W只要V的列k取得适当,总是能从 W = V ⋅ V t W=V·V^t W=VVt获得。但是在数据非常稀疏的时候,因为没有足够的数据来得到W,那么就可以通过 W = V ⋅ V t W=V·V^t W=VVt,V的k取得足够小来得到W。

  1. Parameter Estimation Under Sparsity:

因为FM的因式分解,打破了变量之间的独立性,使我们可以通过一个交互来估计相关交互的参数

  1. Computation:
    在这里插入图片描述
    对于上述公式,时间复杂度是O(k n 2 n^2 n2)

但是对于上述公式成对交互可以重新化简为:
在这里插入图片描述
第一步推导可以从下图得出:
在这里插入图片描述
则复杂度变为了O(kn)

FM as Predictor

  • 可以做回归

  • 二分类

  • 排序

上述都可以使用L2正则来优化防止过拟合

Learning FM

在这里插入图片描述
利用梯度来更新

可以参考我的github来看看源代码,如有错误,欢迎交流。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值