KDD2020|自动特征交互选择(AutoFIS)分解机模型在CTR预估中的应用(已开源)

AutoFIS: Automatic Feature Interaction Selection in Factorization Models for Click-Through Rate Prediction

Bin Liu, Chenxu Zhu, Guilin Li, Weinan Zhang, Jincai Lai, Ruiming Tang, Xiuqiang He, Zhenguo Li, Yong Yu

Huawei Noah’s Ark Lab, Shanghai Jiao Tong University

http://xxx.itp.ac.cn/pdf/2003.11235.pdf

在推荐系统中,特征之间的交互在CT预估中非常重要。现有深度学习模型中,特征交互要么是人工设计要么是简单的枚举。但是,对所有特征交互进行枚举,需要非常大的内存和计算资源。

糟糕的是,无用的交互可能会引入噪声,同时会使训练过程复杂化。这篇文章提出一种二阶段的算法,自动特征交互选择(AutoFIS)。该算法能够自动识别分解机中的重要特征,同时使得计算复杂度跟使得训练的目标模型达到收敛所需复杂度基本等同。

在搜索阶段,不是在候选特征交互的离散集合上搜索,将选择特征交互的方式通过引入结构参数放宽到连续性搜索。在结构参数上执行正则优化,模型可以在训练过程中自动识别并且移除冗余特征交互。

在重新训练阶段,将结构参数作为注意力单元,这样可以进一步提升模型性能。

在三个大规模数据集(两个公开数据集,一个私有数据集)上的离线实验表明,AutoFIS可以显著提升多个基于FM的模型的效果。AutoFIS已经部署到华为应用上推荐服务的训练平台上,10天的线上A/B测试表明AutoFIS相对DeepFM模型CTR提升20.3%,CVR提升20.1%。

部分现有方法的缺陷在于

之前也出现了一些基于深度学习的方法

作者们所提算法简介如下

该算法所带来的效果及在特征选择方面的优化点简介如下

这篇文章的主要贡献在于

部分现有CTR预估算法简介如下

数模型的缺陷在于

这篇文章的基准模型及简介如下

FM deepFM IPNN结构对比如下

特征嵌入层的输入输出形式如下

特征交互层形式如下

MLP层的形式如下

针对输出层,三个模型的表达式区别如下

目标函数定义如下

AutoFIS第一步,搜索阶段简介如下

AutoFIS 结构图示如下

为了更好的衡量各个特征交互的重要性,作者们考虑加入BN,详情如下

GRDA优化方法简介如下

一步优化方法简介如下

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值