RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction

Tongwen Huang, Zhiqi Zhang, Junlin Zhang

Sina Weibo Inc.

https://arxiv.org/pdf/1905.09433.pdf

在facebook,新浪微博这种互联网公司中,广告以及信息流排序至关重要。

很多实际广告和信息流排序系统中,点击率预估起着核心作用。关于点击率预估,现有的比较流行的模型包括了逻辑回归,基于树的模型,基于分解机的模型,还包括了基于深度学习的模型。

但是,很多现有工作计算特征交互的方式比较简单,比如内积等,这些方式对特征重要性没有过多关注。

这篇文章提出一种新的模型,FiBiNET,全称为Feature Importance and Bilinear feature Interaction NETwork,该模型能够动态学习特征重要性以及细粒度的特征交互。FiBiNET能够利用Squeeze-Excitation网络 (SENET)机制来学习特征重要性,而且,该网络能够利用双线性函数蓝学习特征之间的交互。

在两个真实数据集上的大量实验表明,这种浅层网络效果优于其他浅层模型,比如FM,FFM。为了进一步提升效果,将这种网络与经典的DNN结合得到一种深层模型。深层FiBiNET优于其他效果非常好的模型,比如DeepFM以及XdeepFM。

这篇文章的贡献如下

640?wx_fmt=png

这种新网络的组成描述如下

640?wx_fmt=png

整体结构图示如下

640?wx_fmt=png

embedding层的组成及维度描述及标记如下

640?wx_fmt=png

SENET流程描述如下

640?wx_fmt=png

SENET所对应的结构图示如下

640?wx_fmt=png

其中Squeeze的过程主要依赖于pooling操作

640?wx_fmt=png

excitation操作的描述如下

640?wx_fmt=png

该操作类似于自编码操作

reweight操作过程描述如下

640?wx_fmt=png

关于特征交互,本文的方法结合了内积和Hadamard积

图示如下

640?wx_fmt=png

特征交互又分为三种情况

640?wx_fmt=png

640?wx_fmt=png

各种情况下参数总数不同,第三种交互所需参数最多

连接层比较简单,将两个向量拼接起来

640?wx_fmt=png

几种模型之间的关系如下

640?wx_fmt=png

数据集描述及分割策略如下

640?wx_fmt=png

评价标准及特性如下

640?wx_fmt=png

实验环境及参数设置如下

640?wx_fmt=png

在浅层模型的效果对比如下

640?wx_fmt=png

在深层模型中效果对比如下

640?wx_fmt=png

不同的交互组合方式效果对比如下

640?wx_fmt=png

这里的不同组合解释示例如下

640?wx_fmt=png

不同的双线性交互效果对比如下

640?wx_fmt=png

针对embedding层大小,实验结果对比如下

640?wx_fmt=png

层数对模型效果影响如下

640?wx_fmt=png

隐含层单元数对模型效果影响如下

640?wx_fmt=png

不同成分的影响如下

640?wx_fmt=png

其中BI SE分别对应双线性交互层以及SENET

640?wx_fmt=png


              smiley_12.png我是分割线smiley_12.png


您可能感兴趣

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值