论文解读:点击率模型特征交叉CAN模型

本文深入解析了点击率模型中的CAN(Co-Action Network)模型,该模型通过动态耦合特征交互,减少了参数爆炸问题,提高了泛化能力。在生产环境中,CAN模型经过序列截断、特征组合优化和计算内核改进,实现了性能提升。然而,如何处理不同密度特征节点的信息容量和扩展到更高阶特征交叉仍是未来挑战。
摘要由CSDN通过智能技术生成

论文下载地址

一、背景

通用范式的特征交叉指的是通过组合两个(或多个)特征来学习特征间非线性的组合高阶表达,其收益则是来自通过挖掘特征之间的共现组合,拓展了特征输入的表达,从而使得模型能更容易的学习到共现组合提供的信息。
工业实现方案分为非参数化方案和参数化方案:
非参数化方案:显式的表达特征交叉ID,例如特征求交,笛卡尔积特征等。
参数化方案:主要通过模型参数隐式拟合的形式去捕捉特征的非线性组合能力,而参数化方案在DNN基础上的创新迭代又主要分为以下两类范式:

  • 范式一:通过模型参数拟合的过程中能够明确特征的交互关系,例如DeepFM,IPNN,ONN,以及本文的CAN。
  • 范式二:无法明确特征具体交互关系,通过设计更复杂的后端网络追求特征的implict组合和高阶融合,例如DCN,xDeepFM,FIBNET。

传统笛卡尔缺点:

  1. 参数爆炸,将给在离线系统带来巨大的负担;
  2. 组合之间不存在信息共享,笛卡尔积产生一个新的特征和相应的嵌入。由于不同的特征对可能具有相同的特征,因此任意两个特征对之间存在隐含的相似度,而笛卡尔积忽略了这一点。

二、模型设计

总体结构图

  • 4
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值