论文总结《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction（DeepFM）》

Ordiiii

已于 2023-08-03 19:56:32 修改

阅读量102

收藏

点赞数

分类专栏：论文笔记和总结文章标签：论文笔记

于 2023-08-03 19:14:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/archerrrrr/article/details/132090069

版权

论文笔记和总结专栏收录该内容

7 篇文章 0 订阅

订阅专栏

原文链接

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

论文复现代码

Motivation

在这篇文章以前，一些CTR预测模型模型要么关注 low-order feature，要么关注 high-order feature，或者包括了 low- and high-order feature（比如Google的 Wide & Depp模型），但需要对输入作额外的特征工程

contributions

通过FM的线性以及二阶非线性特征提取能力 + MLP的高阶非线性提取能力构造了deepFM模型，可以同时捕获high- and low-order feature
不需要对输入作特征工程，而是直接将其映射为embedding（改embedding共享MLP输入和FM的二阶因子）

模型结构

FM Component

FM Component提取一阶和二阶特征关系，FM的公式如下：
在这里插入图片描述如图可知，其不仅仅是特征的线性组合，还 model 了特征间的关系。相比于矩阵分解（MF）带来了一些非线性性质，但朴素的FM无法提取二阶以上的特征间的关系，而理论上说，FM可以拓展到任意阶的非线性。而论文是采用MLP来捕获高阶非线性特征关系，可能是受到了当时最新的Google Wide & Deep 网络结构的影响。

在这里插入图片描述

Deep Component

在这里插入图片描述对于Deep部分，其将离散的特征直接映射到embedding再将其concat从而作为MLP的输入，论文中对比了不同MLP结构，在该模型中最优的结构是每层神经元的数量相同

deepFM

在这里插入图片描述
最后将两部分的计算结果简单的相加即为deepFM模型的最终输出

EXPERIMENTS

数据集

Criteo Dataset，这是Kaggle上一个关于CTR预测的比赛数据集
Company∗ Dataset，这是华为公司自己的数据集

Evaluation Metrics

AUC
Logloss（cross entropy）

对比实验

在这里插入图片描述这是DeppFM与一些模型的对比，后面还要超参数的一些小实验可以看原文

总结与思考

Wide & Deep 结构是一个经典的结构，在学习MLP的时候很多时候都是利用的这种结构来提取特征，那么是否还能用其它的结构来预测CTR
如果利用FM来提取order-1 feature的关系，MLP作为order-2 feature的关系，是否能利用MLP来提取feature之间复杂的关系（包括order-1和order-2），毕竟MLP能拟合一切关系，不过缺点就是复杂度太高，效率不高

Ordiiii

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Ordiiii CSDN认证博客专家 CSDN认证企业博客

码龄5年

暂无认证

134: 原创

30万+: 周排名

212万+: 总排名

4万+: 访问

: 等级

1515: 积分

25: 粉丝

83: 获赞

27: 评论

124: 收藏

私信

关注

热门文章

分类专栏

论文笔记和总结 7篇
题解 77篇
LeetCode-hot100 63篇
算法 79篇
AI 1篇
csapp 2篇
蓝桥杯 23篇
web框架 1篇
Java学习笔记 5篇

最新评论

蓝桥杯——全球变暖
code_dreamer123: 不对，就是一，老哥
蓝桥杯——全球变暖
m0_66809638: 第二个样例是2
蓝桥杯——乘积最大
麻瓜就这样.: 厉HAi
蓝桥杯——后缀表达式
Ordiiii: 是这样的，如果负号个数不为0，那么实际上可以通过符号使得正号变为负号，也能使得负号变为正号 1. -(a + b) = -a - b ：负号个数加1 2. -(a - b) = -a + b：负号个数减1 推广至多个数，则只要负号不为0，则运算过程中可以对加或者减去某个数，为了结果最大就直接加绝对值当然，第一个数要加上，例如 a + b + c，负号为2个，数为3个，则使得结果最大，一定先加一个最大数。并且如果有负号，则也一定至少减去一个数（这个无法被转换为正号，因为没有更多负号帮助它），则减去最小值所以 res = a[k - 1] - a[0]，就是加最大值，减最小值剩下的直接加绝对值
蓝桥杯——后缀表达式
我爱学习168: 不懂这个： else { res = a[k - 1] - a[0]; for(int i = 1;i < k - 1;i ++) res += abs(a[i]); }可以解释一下吗，前面的解释我也看不懂

大家在看

最新文章

2023年71篇

2021年28篇

2020年35篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值