Deep Crossing: Web-Scale Modeling without Manually Crafted Combinatorial Features(2016)

Deep Crossing: Web-Scale Modeling without Manually Crafted Combinatorial Features(2016)

(0)个人小结

FM 也为特征交叉提供了方法,其思路是将特征相乘并学习得到一个权重,一般用于二阶特征交叉,高于二阶时将面临计算复杂度的问题。Deep Crossing 为高阶特征交叉提供了思路:首先将原始数据映射为 Embedding ,然后将 Embedding 拼接起来,最后经过多层的残差网络进行特征交叉。

(1) 研究目标

提出 Deep Crossing 框架,它是一个旨在解决特征工程中特征组合问题的深度神经网络模型。通过该模型自动学习特征的组合方式,生成高阶特征,从而降低人工特征组合的开销。

(2) 背景 & 问题描述

背景:

传统机器学习是以能够充分利用输入特征为假设来进行预测或者分类的,但是,原生的特征很难取得好的效果,工业界和学术界都在特征工程上花了较多的时间和精力,其中不乏对特征进行组合,然后将组合后的特征作为输入(组合特征又叫:交叉特征、多路特征)。

(3) 研究方法

模型架构:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-G1zzeCUO-1615903759345)(img/image-20210116170710559.png)]

Embedding 层: 将原始特征映射为 Embedding 向量。

Stacking 层: 将所有的 Embedding 向量和部分原始特征拼接成一个向量。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mwCalxCi-1615903759349)(img/image-20210118191507785.png)]

Residual Unit 层: 基于残差单元 Residual Unit 构建的残差层,其输出为:

在这里插入图片描述

Scoring 层:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tTJJtVuI-1615903759352)(img/image-20210118191646521.png)]

损失函数:

在这里插入图片描述

原始残差网络:

在这里插入图片描述

残差是指预测值观测值的差距,而误差是衡量观测值真实值之间的差距。

参考资料:AI算法工程师手册

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值