【FM-RS】真伪DeepFM:DeepFM、xDeepFM

DeepFM IJCAI’17

理解一:这篇文章在模型的设计上紧随Google的Wide & Deep,用FM来代替Wide & Deep的部分,从而可以避免人工设计特征工程。

理解二:分别利用线性模型、FM、DNN得到一阶特征、二阶特征、高阶特征。

模型

我们假设训练集当中一共有 n n n条样本,每一条样本可以写成 ( χ , y ) (\chi, y) (χ,y)。其中的是一个 m m m个field组成的向量,包含了用户和item等组成的特征。 y ∈ { 0 , 1 } y \in\{0,1\} y{ 0,1} y = 0 y=0 y=0表示用户没有点击,相反, y = 1 y=1 y=1表示用户点击。

这m维特征可以看成两部分组成,第一部分是类别特征,比如性别、地理位置、收入情况等等。第二种是连续性特征,比如平均花费、平均停留时间等等。类别特征(categorical feature)一般被表示成一个one-hot之后的向量,而一个连续特征,一般就是表示它自己,当然也可以离散化成one-hot向量。

我们把这些特征全部处理完之后,整个向量会转化成 x = [ x field  1 , x field  2 , ⋯   , x field  m ] x=\left[x_{\text {field }_{1}}, x_{\text {field }_{2}}, \cdots, x_{\text {field }_{m}}\right] x=[xfield 1,xfield 2,,xfield m]。由于这当中做了一些离散化的处理,会使得x向量变得非常稀疏。

image-20210513194210777

模型由三部分组成:

1、 线性模型,原始特征直接输入线性模型得到一个logit值。

2、 每个特征对应一个embedding,embedding互相做内积,得到 m ( m − 1 ) 2 \frac{m(m-1)}{2} 2m(m1)个logit值。

所以以上两部分其实就是FM模型:
y ^ = ∑ i = 1 n w i x i + ∑ i = 1 n − 1 ∑ j = 1 n v i T v j x i , x j \hat{y}=\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i=1}^{n-1} \sum_{j=1}^{n} v_{i}^{T} v_{j} x_{i}, x_{j} y^=i=1nwixi+i=1n1j=1nvi<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值