deepcrossing

最新推荐文章于 2022-01-17 19:47:10 发布

lahuoyi

最新推荐文章于 2022-01-17 19:47:10 发布

阅读量90

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/lahuoyi/article/details/114899905

版权

笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

2.1 Embedding layer
将稀疏的类别特征转成稠密的Embedding向量，Embedding的维度会远小于原始的稀疏特征向量
Embedding是NLP里面常用的一种技术，这里的Feature #1表示的类别特征(one-hot编码后的稀疏特征向量），Feature #2是数值型特征，不用embedding，直接到了Stacking Layer。关于Embedding Layer的实现，往往一个全连接层即可，Tensorflow中有实现好的层可以直接用。和NLP里面的embedding技术异曲同工，比如Word2Vec，语言模型等。

2.2 Stacking layer
这个层是把不同的Embedding的特征和数值型特征拼接在一起，形成新的包含全部特征的特征向量，该层通常也称为连接层, 具体的实现如下，先将所有的数值特征拼接起来，然后将所有的Embedding拼接起来，最后将数值特征和Embedding特征拼接起来作为DNN的输入，这里TF是通过Concatnate层进行拼接。

实现的代码：
#将所有的dense特征拼接到一起
dense_dnn_list = list(dense_input_dict.values())
dense_dnn_inputs = Concatenate(axis=1)(dense_dnn_list) # B x n (n表示数值特征的数量)

因为需要将其与dense特征拼接到一起所以需要Flatten，不进行Flatten的Embedding层输出的维度为：Bx1xdim
sparse_dnn_list = concat_embedding_list(dnn_feature_columns, sparse_input_dict, embedding_layer_dict, flatten=True)

sparse_dnn_inputs = Concatenate(axis=1)(sparse_dnn_list) # B x m*dim (n表示类别特征的数量，dim表示embedding的维度)

将dense特征和Sparse特征拼接到一起
dnn_inputs = Concatenate(axis=1)([dense_dnn_inputs, sparse_dnn_inputs]) # B x (n + m*dim)

2.3 Multiple Residual Units Layer
该层的主要结构是MLP，但DeepCrossing采用了残差网络进行的连接。通过多层残差网络对特征向量各个维度充分的交叉组合，使得模型能够抓取更多的非线性特征和组合特征信息，增加模型的表达能力。

除了残差变化，其他都是DNN的常规套路。

lahuoyi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
deepcrossing

2.1 Embedding layer将稀疏的类别特征转成稠密的Embedding向量，Embedding的维度会远小于原始的稀疏特征向量Embedding是NLP里面常用的一种技术，这里的Feature #1表示的类别特征(one-hot编码后的稀疏特征向量），Feature #2是数值型特征，不用embedding，直接到了Stacking Layer。关于Embedding Layer的实现，往往一个全连接层即可，Tensorflow中有实现好的层可以直接用。和NLP里面的embedding技术异
复制链接

扫一扫