【学习笔记】DeepCrossing

最新推荐文章于 2024-10-13 20:15:58 发布

kerenleii

最新推荐文章于 2024-10-13 20:15:58 发布

阅读量144

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/ytwanzi/article/details/114870171

版权

DeepCrossing模型学习

1.背景

1）2016年由微软提出，是深度学习架构在推荐系统中的完整应用；
2）应用场景是微软搜索引擎Bing中的搜索广告推荐场景，即用户输入搜索词后，搜索引擎除了会返回相关结果，还会返回与搜索词相关的广告。尽可能地增加搜索广告的点击率，准确地预测广告点击率，是Deep Crossing模型的优化目标。
3）微软使用的特征分三类：一类是可以被处理成one-hot或者multi-hot向量的类别型特征，包括用户搜索词(query)、广告关键词(keyword)、广告标题(title)、落地页（landing page）、匹配类型(match type)；一类是数值型特征，微软称其为计数型特征，包括点击率、预估点击率（click prediction）；一类是需要进一步处理的特征，包括广告计划（campaign）、曝光计划(impression)、点击样例(click)等。

2.原理

在这里插入图片描述
模型的输入是一系列个体特征。模型有四种类型的层，包括Embedding层，Stacking层，Residual Unit层和Scoring层。目标函数是log损失函数，也可以使用softmax函数或其他函数。
Embedding： 用来减少输入特征的维度。
Stacking： 通常被称为连接层，作用是将Embedding的输出特征和数值型特征拼接在一起，形成新的包含全部特征的特征向量。
Multiple Residual Units： 该层的主要结构是多层感知机MLP，采用了多层残差网络作为其具体实现。
Scoring： 输出层，为了拟合优化目标而存在的。对于CTR预估这类二分类问题，Scoring层往往使用的是逻辑回归模型。