FiBiNET：结合特征重要性和双线性特征交互进行CTR预估

浅梦s

已于 2022-10-01 15:52:51 修改

阅读量6k

点赞数 4

分类专栏：推荐系统文章标签：推荐系统深度学习点击率预估 CTR预估

于 2019-07-10 10:03:02 首次发布

本文链接：https://blog.csdn.net/u012151283/article/details/95234555

版权

FiBiNET模型结合Squeeze-Excitation网络（SENET）学习特征重要性和双线性交互来改进CTR预估。SENET层通过挤压和兴奋操作动态调整特征权重，而双线性交互层则采用多种类型来更好地建模特征交叉，提高预估准确性。实验在criteo和avazu数据集上展示了优于其他模型的性能。

摘要由CSDN通过智能技术生成

简介

本文主要介绍新浪微博机器学习团队发表在RecSys19上的一项工作。
文章标题为 FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction

文章指出当前的许多通过特征组合进行CTR预估的工作主要使用特征向量的内积或哈达玛积来计算交叉特征，这种方法忽略了特征本身的重要程度。提出通过使用Squeeze-Excitation network (SENET) 结构动态学习特征的重要性以及使用一个双线性函数来更好的建模交叉特征。

下面对该模型进行一个简单的介绍并提供核心代码实现以及运行demo,细节问题请参阅论文。

模型结构

整体结构

图中可以看到相比于我们熟悉的基于深度学习的CTR预估模型，主要增加了SENET Layer和Bilinear-Interaction Layer两个结构。下面就针对这两个结构进行简单的说明。

SENET Layer

SENET Layer的主要作用是学习不同特征的一个重要程度，对重要特征加权，对蕴含信息量不多的特征进行削弱。对于该结构的更详细的介绍可以参考论文Squeeze-and-Excitation Networks

该使用特征组的embedding向量作为输入，产生一个特征组权重向量 $A=[{a_1,...,a_i,...a_f}]$ ,最后将原始特征组embedding向量 $E$ 乘上 $A$ 得到一组新的embedding向量 $V=[{v_1,...,v_i,...v_f}]$
具体来说，分为3个步骤：

Squeeze

在这里插入图片描述
这一步主要是对每个特征组中的embedding向量进行汇总统计量的操作。文章使用了池化操作来对原始特征组embedding向量 $E=[e_1,...,e_f]$ 进行压缩表示得到统计向量 $Z=[z_1,...,z_i,...z_f]$ ，其中 $z_i$ 表示第 $i$ 个特征的全局信息。 $z_i$ 可以通过如下的平均池化的方式计算得到：
$z_i=F_{sq}(e_i)=\frac{1}{k}\sum_{t=1}^ke_i^{(t)}$