RecSys 特征交叉 - FinalMLP

最新推荐文章于 2024-08-12 20:46:44 发布

GelaBute

最新推荐文章于 2024-08-12 20:46:44 发布

阅读量240

点赞数 4

文章标签：推荐算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41196438/article/details/140997405

版权

《FinalMLP: An Enhanced Two-Stream MLP Model for CTR Prediction》

1 Intro

特征交叉对于ctr模型很重要
当前普遍认为普通MLP不足以学习到丰富的特征交叉信息，因此很多采用MLP+其他特征显示交叉结构组合，实现 two-Stream model 来进行ctr预估。
本文提出了MLP+MLP的网络结构，比MLP+交叉结构对比，证明了简单MLP的组合也能达到很好效果

2 模型结构

在这里插入图片描述
核心思想：

enable stream differentiation：减少两个组合单元的同质化学习，更可能保证特征交互学习的互补
better fuse the stream outputs ：保证stream之间有效的信息交叉

2.1 enable stream differentiation

调整两边MLP的网络深度、宽度
差异化MLP的input - Stream-Specific Feature Selection（Fig.1 (a)），通过控制门控input，调整stream对各特征的侧重点差异

2.2 Stream-Level Interaction Aggregation

2.2.1 Bilinear Fusion

在这里插入图片描述

蓝框部分为Bilinear Fusion核心： $o_1$ 和 $o_2$ 的2阶交互。
当 $W_3$ 全0时，Stream-Level Interaction Aggregation 退化成concate（红框）

2.2.2 Multi-Head Bilinear Fusion

当 $o_1$ 和 $o_2$ 维度比较大时，参数量会爆炸。因此：

将stream的output划分成多个子空间（k为子空间数，超参）
再将多个子空间Bilinear Fusion结果加和

参数量 $\mathcal O(d_1d_2)$ -> $\mathcal O(d_1d_2/k)$

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
RecSys 特征交叉 - FinalMLP

维度比较大时，参数量会爆炸。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。