推荐模型-上下文感知-2016：FNN模型【FM家族】【FM+MLP=FNN】

u013250861

已于 2022-11-27 16:16:38 修改

阅读量310

点赞数

分类专栏： # RS/上下文推荐(FM因子分解系列) 文章标签：人工智能推荐系统 FNN

于 2021-10-31 23:45:00 首次发布

本文链接：https://blog.csdn.net/u013250861/article/details/121060987

版权

RS/上下文推荐(FM因子分解系列) 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

在这里插入图片描述

Weinan Zhang1 et al. “Deep Learning over Multi-field Categorical Data” in ECIR 2016

FNN模型是2016提出来的，当时各大公司都还在探索如何将深度学习技术应用于推荐系统，一些头部公司开始了初步的尝试，比如Google应用并发表了Wide&Deep模型，微软在Bing的搜索广告场景尝试了Deep Crossing模型，都是那个时代的代表模型，对业界发展起到了重要作用。不过即使是号称完全自动化特征工程的Deep Crossing模型，也没有做显式特征交叉。那深度学习时代，能否让模型既有像FM那样做显式特征交叉，又具备DNN的隐式高阶交叉和泛化能力呢？FNN就是这样的尝试，试图将FM和DNN结合起来，模型结构如图2所示。

在这里插入图片描述
模型的核心思想是采用FM训练得到的隐向量作为神经网络第一层权重的初始值，之后是隐藏层，最后是点击率预估的输出。其实是一个Embedding + MLP结构，特殊的是Embedding的初始值是FM模型已经预训练好的结果。FM与Embedding的初始化对应关系如图3所示。
在这里插入图片描述
FNN全称Factorisation Machine supported Neural Network，如果用一句简短的话概括FNN那就是：FM+MLP，如果再用一句稍显复杂的话概括FNN那就是：FNN是一个两阶段训练的模型，阶段一先训练一个FM模型得到每个field的embedding向量，阶段二，基于阶段一的embedding向量初始化MLP的embedding层，然后训练一个MLP（DNN）。

由于Embedding的初始值得到了FM的预训练，因此在训练DNN的时候，模型收敛速度更快；并且Embedding包含了组合特征的信息，可以不用做额外的特征工程；DNN在FM的基础上对特征组合做了进一步的高阶特征组合，模型能得到更好的效果。不过由于整个训练过程分成了两阶段，其实不是一个端到端的训练过程，而是一种基于参数的迁移学习。

FNN存在的问题有：

Embedding参数受FM的影响，模型能力受限于FM表征能力的上限；
训练过程分两阶段进行，过程较复杂，效率不高；
FNN只能学习高阶特征组合，没有对低阶特征建模，但很多特征的高阶交叉是无意义的。

参考资料：
神经网络中的几个FM家族模型（FNN、NFM、AFM、DeepFM）
神经网络中的几个FM家族模型（FNN、NFM、AFM、DeepFM）

u013250861

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐模型-上下文感知-2016：FNN模型【FM家族】【FM+MLP=FNN】

FNN模型是2016提出来的，当时各大公司都还在探索如何将深度学习技术应用于推荐系统，一些头部公司开始了初步的尝试，比如Google应用并发表了Wide&Deep模型，微软在Bing的搜索广告场景尝试了Deep Crossing模型，都是那个时代的代表模型，对业界发展起到了重要作用。由于Embedding的初始值得到了FM的预训练，因此在训练DNN的时候，模型收敛速度更快；模型的核心思想是采用FM训练得到的隐向量作为神经网络第一层权重的初始值，之后是隐藏层，最后是点击率预估的输出。.............
复制链接

扫一扫

专栏目录