【FM-RS】真伪DeepFM：DeepFM、xDeepFM

最新推荐文章于 2022-08-28 08:49:04 发布

chad_lee

最新推荐文章于 2022-08-28 08:49:04 发布

阅读量287

点赞数

分类专栏：推荐系统论文解读 CTR 文章标签：机器学习深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanguang1470/article/details/121409583

版权

DeepFM IJCAI’17

理解一：这篇文章在模型的设计上紧随Google的Wide & Deep，用FM来代替Wide & Deep的部分，从而可以避免人工设计特征工程。

理解二：分别利用线性模型、FM、DNN得到一阶特征、二阶特征、高阶特征。

模型

我们假设训练集当中一共有 $n$ 条样本，每一条样本可以写成 $(\chi, y)$ 。其中的是一个 $m$ 个field组成的向量，包含了用户和item等组成的特征。 $\in\{0,1\}$ ， $y = 0$ 表示用户没有点击，相反， $y = 1$ 表示用户点击。

这m维特征可以看成两部分组成，第一部分是类别特征，比如性别、地理位置、收入情况等等。第二种是连续性特征，比如平均花费、平均停留时间等等。类别特征（categorical feature）一般被表示成一个one-hot之后的向量，而一个连续特征，一般就是表示它自己，当然也可以离散化成one-hot向量。

我们把这些特征全部处理完之后，整个向量会转化成 $x=\left[x_{\text {field }_{1}}, x_{\text {field }_{2}}, \cdots, x_{\text {field }_{m}}\right]$ 。由于这当中做了一些离散化的处理，会使得x向量变得非常稀疏。

模型由三部分组成：

1、线性模型，原始特征直接输入线性模型得到一个logit值。

2、每个特征对应一个embedding，embedding互相做内积，得到 $\frac{m(m-1)}{2}$ 个logit值。

所以以上两部分其实就是FM模型：
$\hat{y}=\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i=1}^{n-1} \sum_{j=1}^{n} v_{i}^{T} v_{j} x_{i}, x_{j}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【FM-RS】真伪DeepFM：DeepFM、xDeepFM

DeepFM IJCAI’17理解一：这篇文章在模型的设计上紧随Google的Wide & Deep，用FM来代替Wide & Deep的部分，从而可以避免人工设计特征工程。理解二：分别利用线性模型、FM、DNN得到一阶特征、二阶特征、高阶特征。模型我们假设训练集当中一共有nnn条样本，每一条样本可以写成(χ,y)(\chi, y)(χ,y)。其中的是一个mmm个field组成的向量，包含了用户和item等组成的特征。y∈{0,1}y \in\{0,1\}y∈{0,1}，y=0y=0
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。