因子分解机 FM

最新推荐文章于 2024-07-12 17:35:14 发布

浮汐

最新推荐文章于 2024-07-12 17:35:14 发布

阅读量389

点赞数

分类专栏： ML

本文链接：https://blog.csdn.net/xfxlesson/article/details/115314769

版权

因子分解机FM是一种高效模型，尤其适合稀疏数据，通过特征的低秩展开学习二阶特征组合。与Poly-2模型相比，FM模型参数更少，能有效学习未出现的特征组合。此外，FFM通过引入特征域概念优化FM，增加模型复杂度，而DeepFM结合FM和DNN，同时学习低阶和高阶特征组合，提供端到端解决方案。

摘要由CSDN通过智能技术生成

背景

在人工方式的特征工程，通常有两个问题：
1、特征爆炸
2、大量重要的特征组合都隐藏在数据中，无法被专家识别和设计

针对上述两个问题，广度模型和深度模型提供了不同的解决思路。

1、广度模型包括FM/FFM等大规模低秩(Low-Rank)模型，FM/FFM通过对特征的低秩展开，为每个特征构建隐式向量，并通过隐式向量的点乘结果来建模两个特征的组合关系实现对二阶特征组合的自动学习。作为另外一种模型，Poly-2模型则直接对2阶特征组合建模来学习它们的权重。FM/FFM相比于Poly-2模型，优势为以下两点。第一，FM/FFM模型所需要的参数个数远少于Poly-2模型：FM/FFM模型为每个特征构建一个隐式向量，所需要的参数个数为 O(km)，其中k为隐式向量维度，m为特征个数；Poly-2模型为每个2阶特征组合设定一个参数来表示这个2阶特征组合的权重，所需要的参数个数为 O(m2)。第二，相比于Poly-2模型，FM/FFM模型能更有效地学习参数：当一个2阶特征组合没有出现在训练集时，Poly-2模型则无法学习该特征组合的权重；但是FM/FFM却依然可以学习，因为该特征组合的权重是由这2个特征的隐式向量点乘得到的，而这2个特征的隐式向量可以由别的特征组合学习得到。总体来说，FM/FFM是一种非常有效地对二阶特征组合进行自动学习的模型。

2、深度学习是通过神经网络结构和非线性激活函数，自动学习特征之间复杂的组合关系。目前在APP推荐领域中比较流行的深度模型有FNN/PNN/Wide & Deep。FNN模型是用FM模型来对Embedding层进行初始化的全连接神经网络。PNN模型则是在Embedding层和全连接层之间引入了内积/外积层，来