DeepFM原理解析

最新推荐文章于 2024-06-30 00:06:57 发布

xiaobaichao__ml

最新推荐文章于 2024-06-30 00:06:57 发布

阅读量2.5k

点赞数

分类专栏：广告&推荐文章标签：推荐系统机器学习深度学习

本文链接：https://blog.csdn.net/xiaobaichao__ml/article/details/82181593

版权

DeepFM模型结合了FM的低阶特征组合与DNN的高阶特征挖掘，解决了推荐系统中CTR预估的问题。它在FM的基础上引入深度学习，通过共享输入解决了手工制作组合特征的难题，同时在效率和性能上超越了LR、FM等传统模型。在DeepFM的实现中，FM的隐向量用于初始化embedding层，以优化网络性能。

摘要由CSDN通过智能技术生成

- - 序
  - FM
  - DeepFM
  - 代码理解
  - tricks

序

推荐系统中常用的模型是Logistic Regression。但是其没有考虑特征之间的相互关系，如果要使得模型学到这种相互关系的能力，则必须手动制作相应的相关特征，工作量巨大；为了解决这个问题，使用FM，FFM对组合特征进行学习；然而FM，FFM只考虑了低阶特征的组合，并未考虑高阶特征的组合，所以一种合理的思路就是使用Deep+FFM的组合模型，即为接下来要介绍额DeepFM模型。

推荐系统中的CTR预估是预测用户点击推荐物品的概率。大部分推荐系统的目标是最大化点击次数，因此要推荐给用户的物品的排序策略，直接按预估的CTR大小排序即可；但在其他场景如在线广告，目标是最大化收益，因此排序策略调整为按所有候选item的CTR*bid，bid是item被user点击后系统的收益。两种场景的关键都是要准确预估CTR。

FM

参见为知笔记《ZJ_FM》

DeepFM

FM考虑了低阶特征的组合问题，但是无法解决高阶特征的挖掘问题，所以才引入了DeepFM。DeepFM是一个集成了FM和DNN的神经网络框架，思路和google的Wide&Deep有相似的地方，Wide&Deep包括wide和deep两部分，其中wide部分是高维线性模型，DeepFM的wide部分则是FM模型；二者的deep部分都是dnn层。 DNN隐藏层的激活函数用ReLu和Tanh，Sigmoid函数做CTR预估的输出函数。