推荐系统笔记7-DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction

最新推荐文章于 2024-07-07 21:59:24 发布

年少_当自强

最新推荐文章于 2024-07-07 21:59:24 发布

阅读量1.4k

点赞数 1

分类专栏：推荐系统机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/buwei0239/article/details/86767737

版权

本文介绍了DeepFM模型，它结合了FM和DNN，用于点击率(CTR)预测。DeepFM能自动学习高低阶特征交互，避免过度依赖特征工程。模型包括FM组件和Deep组件，两者共享输入。实验表明DeepFM在Criteo和公司数据集上表现出优越的性能。

摘要由CSDN通过智能技术生成

本文介绍DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction，原文Paper链接；

具体的代码实现见Github

摘要

对于CTR问题，学习特征交互是至关重要的问题，文中提出DeepFM(DNN+FM)；

一、介绍

关于特征交互的作用，文中给出了一个例子：1、如人们经常在要吃饭的时候下载关于food的APP，所以APP和时间戳的二阶交互可以是一个很重要的预测信号；2、青少年男生更喜欢玩射击类游戏，所以可以引入三阶特征交互(APP类型+用户性别+用户年龄)；但是这些都是很复杂的，同时考虑低阶和高阶特征交互，是要优于只用两个中的一个的；
虽然专家可以引入很好的特征交互，但是也存在问题，比如啤酒和尿布的故事，它们的关系被发现是通过大量的数据挖掘出来的，是由ML自动发现的；一系列对于CTR的研究开展：FTRL、FM、CNN/RNN、FNN、PNN、Wide&Deep等等；可以看出这些模型要么偏向低阶，要么偏向高阶特征组合，要么依赖特征工程；所以，文中的DeepFM自动学习高低阶，且是端到端的学习；

二、方法

假设输入数据是 $(X, y)$ 且 $X$ 是m个field的数据，y是{0,1}变量，且 $X$ 由类别变量和连续变量组成，类别变量One-hot处理；

2.1、 DeepFM

DeepFM的网络架构如下图所示：
在这里插入图片描述
DeepFM由两部分组成：FM+Deep，他们共享相同的输入，其整个模型定义为： $\hat y(x) = sigmoid({y_{FM}}(x) + {y_{Deep}}(x))$

最低0.47元/天解锁文章

年少_当自强

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
推荐系统笔记7-DeepFM: An End-to-End Wide & Deep Learning Framework for CTR Prediction

本文介绍DeepFM: An End-to-End Wide &amp;amp;amp; Deep Learning Framework for CTR Prediction，原文Paper链接；摘要对于CTR问题，学习特征交互是至关重要的问题，文中提出DeepFM(DNN+FM)；一、介绍关于特征交互的作用，文中给出了一个例子：1、如人们经常在要吃饭的时候下载关于food的APP，所以APP和时间戳的二...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。