RecSys特征交叉 - ContextNet

ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding

1 Intro

  1. 特征交叉是CTR任务的关键
  2. 当前部分模型 (FNN and DeepFM) 用浅层MLP交叉特征效果不强;xDeepFM等用复杂子网络实现,但落地性较弱;AutoInt and Fi-GNN虽然也可以通过求和方式动态调整fea emb,但也效果不显

2 Framework

ContextNet由两部分组成:

  • Contextual Embedding:对于items,将其全部特征视为其每个特征的context;该模块聚合context信息,并投影到单个特征维度
  • ContextNet block:将每个特征的专属聚合contextual information合入该特征,并经过非线性变化强化特征交叉;ContextNet block可不断堆叠

2.1 Contextual Embedding

在这里插入图片描述

红框 - context聚合函数,蓝框 - 投影函数。 E i E_i Ei - item第 i 个特征, E E E - item全部特征。
在这里插入图片描述

论文用两层MLP来实现Contextual Embedding,其中:

  • 聚合层(Aggregation) 只接受原始的fea emb输入 E E E,认为只有这样才包含原始和全局信息
  • 为了加快性能,不同fea field的聚合层可共享参数,但投影层(Projection) 需要确保每个fea field独立抽取

2.2 ContextNet Block

在这里插入图片描述

  • merge func采用Hadamard product
    在这里插入图片描述
  • non-linear func有两种形式 (后续实验证明SFFN更好)
    在这里插入图片描述
    • PFFN (Point-Wise Feed-Forward Network)
      在这里插入图片描述
    • SFFN (Single-Layer Feed-Forward Network)
      在这里插入图片描述

3 Expr

1.蓝框相对较弱,证明通过子网络引入高阶交叉特征很有用;红比黄强,证明得到交叉特征后,乘比加的融合方式有用;ContextNet-SFFN最强
在这里插入图片描述2.Contextual Embedding中,共享聚合层(Aggregation)在不显著影响性能的前提下减少参数量,共享投影层会导致模型性能显著下降
在这里插入图片描述
在这里插入图片描述
3.消融实验:Contextual Embedding、FFN和FFN中的非线性变化LayerNorm都有用
4.ContextNet Block堆叠
在这里插入图片描述
5. fea emb size:过大可能会导致过拟合,模型效果下降
在这里插入图片描述
6. 评估各特征的相似性。随着ContextNet Block堆叠,特征逐渐聚焦到特定的交互特征。(越相似,代表越深的交互)
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值