论文阅读【4】Product-based Neural Networks for User Response Prediction

请添加图片描述

巨大的特征空间给推荐系统的训练带来困难,本篇论文提出一个基于点积操作的神经网络,它用一个嵌入层学习分类数据的分布表示,通过product layer学习不同领域特征的交互特征,进而获得高阶特征的交互作用。实验表明product layer有效。

问题描述

本文以预测CTR(Click-through rate)为目标,具体问题见博客:论文阅读【3】Deep & Cross Network for Ad Click Predictions

本文核心思想

在这里插入图片描述
product layer是本文的核心,这一层获得交互特征,本文使用一些特殊的参数矩阵构造以及函数设定减小了时间开销,缩小了模型复杂度。

实现细节

输出层: y ^ = σ ( W 3 l 2 + b 3 ) \hat y =\sigma(W_3l_2+b_3) y^=σ(W3l2+b3) W 3 ∈ R 1 ∗ D 2 b 3 ∈ R W_3\in R^{1*D_2} b_3\in R W3R1D2b3R
Hidden Layer 2: l 2 = r e l u ( W 2 l 2 + b 2 ) l_2=relu(W_2l_2+b_2) l2=relu(W2l2+b2) l 1 ∈ R D 1 l_1\in R^{D_1} l1RD1
Hidden Layer 1: l 1 = r e l u ( l z + l p + b 1 ) l_1=relu(l_z+l_p+b_1) l1=relu(lz+lp+b1) l z , l p , b 1 ∈ R D 1 l_z,l_p,b_1∈R^{D_1} lz,lp,b1RD1

Product Layer

l z = ( l z 1 , l z 2 , … . l z D 1 ) , l z n = W z n ⊙ z l_z=(l_z^1,l_z^2,….l_z^{D_1}),l_z^n=W_z^n⊙z lz=(lz1,lz2,.lzD1),lzn=Wznz
l p = ( l p 1 l p 2 , … . l z D 1 ) , l p n = W p n ⊙ p l_p=(l_p^1 l_p^2,….l_z^{D_1} ),l_p^n=W_p^n⊙p lp=(lp1lp2,.lzD1),lpn=Wpnp
其中 z = ( z 1 , z 2 , … z N ) ≔ ( f 1 , f 2 , … f N ) z=(z_1,z_2,…z_N )≔(f_1,f_2,…f_N ) z=(z1,z2,zN):=(f1,f2,fN) p = { p i , j } , i = 1 , 2 , … N ; j = 1 , 2 , … N , p i , j = g ( f i , f j ) ; f i = W 0 i x [ s t a r t i : e n d i ] ∈ R M p=\{p_{i,j}\}, i=1,2,…N; j=1,2,…N, p_{i,j}=g(f_i,f_j); f_i=W_0^ix[start_i:end_i]\in R^M p={pi,j},i=1,2,N;j=1,2,N,pi,j=g(fi,fj);fi=W0ix[starti:endi]RM。对于 g g g W p n W_p^n Wpn的设计是IPNNOPNN的贡献。

本文提出2个PNN变形:IPNNOPNN

IPNN

g ( f i , f j ) = < f i , f j > g(f_i,f_j )=<f_i,f_j> g(fi,fj)=<fi,fj> W p n = θ n θ n T W_p^n=\theta ^n {\theta^n}^T Wpn=θnθnT 最终推导出 l p = ( ∣ ∣ ∑ i δ i 1 ∣ ∣ , ∣ ∣ ∑ i δ i 2 ∣ ∣ , … ∣ ∣ ∑ i δ i D 1 ∣ ∣ ) l_p=(||∑_iδ_i^1 ||,||∑_iδ_i^2 ||,…||∑_iδ_i^{D_1}||) lp=(iδi1,iδi2,iδiD1)

OPNN

g ( f i , f j ) = f i f i T ∈ R M ∗ M g(f_i,f_j )=f_i f_i^T∈R^{M*M} g(fi,fj)=fifiTRMM p = ∑ i = 1 N ∑ j = 1 N f i f j T = f ∑ f ∑ T p=\sum_{i=1}^N\sum_{j=1}^N f_if_j^T=f_{\sum}f_{\sum}^T p=i=1Nj=1NfifjT=ffT 其中, f ∑ = ∑ i = 1 N f i f_{\sum}=\sum_{i=1}^Nf_i f=i=1Nfi

为什么有效

PNNFNNFM类似,又有所不同:将product layer去除PNNFNN相同,而product layer的设计和FM类似,实验结果表明PNNFNNFM的实验结果都好。product layer的设计探索了不同特征之间的交互特性,并用 l p l_p lp的结果表示出来。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值