TensorFlow2.0入门到进阶2.11 —— wide&deep模型

最新推荐文章于 2024-02-29 06:08:01 发布

努力改掉拖延症的小白

最新推荐文章于 2024-02-29 06:08:01 发布

阅读量1.6k

点赞数 2

分类专栏： TensorFlow2.0入门到进阶文章标签：深度学习机器学习人工智能大数据计算机视觉

本文链接：https://blog.csdn.net/caoyuan666/article/details/105869670

版权

TensorFlow2.0入门到进阶专栏收录该内容

26 篇文章 48 订阅

订阅专栏

在这里插入图片描述

文章目录

1、简介
2、特征
- 2.1 稀疏特征
- 2.2 密集特征
3、分解
- 3.1 wide models
- 3.2 deep models
4、实战

1、简介

Wide and deep 模型是 TensorFlow 在 2016 年 6 月左右发布的一类用于分类和回归的模型，并应用到了 Google Play 的应用推荐中。详见论文： Wide & Deep Learning for Recommender Systems

Wide and deep 是一种融合浅层（wide）模型和深层（deep）模型进行联合训练的框架，综合利用浅层模型的记忆能力和深层模型的泛化能力，实现单模型对推荐系统准确性和扩展性的兼顾。

wide and deep 模型的核心思想是结合线性模型的记忆能（memorization）和 DNN 模型的泛化能力（generalization），在训练过程中同时优化 2 个模型的参数，从而达到整体模型的预测能力最优。

记忆（memorization）即从历史数据中发现item或者特征之间的相关性。
泛化（generalization）即相关性的传递，发现在历史数据中很少或者没有出现的新的特征组合。

性能比较：

效果上，在Google Play 进行线上A/B实验，W&D模型相比高度优化的Wide浅层模型，app下载率+3.9%。相比deep模型也有一定提升。
性能上，通过切分一次请求需要处理的app 的Batch size为更小的size，并利用多线程并行请求达到提高处理效率的目的。单次响应耗时从31ms下降到14ms。

2、特征

2.1 稀疏特征

在这里插入图片描述

2.2 密集特征

在这里插入图片描述

3、分解

3.1 wide models

通俗来说，wide就是层数比较浅的是基础的线性模型，主要为传统模型中的基础特征和交叉特征。

在目前大规模线上推荐排序系统中，通用的线性模型如LR被广泛应用。线性模型通常输入二进制的one-hot稀疏表示特征进行训练。比如特征“user_installed_app=netflix”为1，表示用户已安装netflix。交叉特征AND（user_installed_app=netflix，impresion_app=Pandora）表示既安装了netflix app同时又浏览过Pandora的用户特征为1，否则为0。wide模型可以通过利用交叉特征高效的实现记忆能力，达到准确推荐的目的。wide模型通过加入一些宽泛类特征实现一定的泛化能力。但是受限与训练数据，wide模型无法实现训练数据中未曾出现过的泛化。
在这里插入图片描述