RS Meet DL(82)-[阿里]可视化分析点击率预估模型

本文介绍的论文题目为:《Visualizing and Understanding Deep Neural Networks in CTR Prediction》
论文下载地址为:https://arxiv.org/abs/1806.08541

本文从预测值、神经元状态、特征梯度强度等几个方面入手,对点击率预估模型进行了可视化分析,一起来了解一下。

1、数据集介绍

先介绍一下本文使用的数据集,本文使用的数据是阿里广告平台收集到的日志数据。一共有8天,训练集从第一天的数据中采样得到,而测试集按天进行采样,每天的测试集作为单独的一组(test1代表第一天的测试集,test2代表第二天的测试集,依次类推),并且第一天的测试集和训练集没有交叉。

输入特征共有34组离散特征,如用户id、用户所在城市id、用户性别、用户年龄分集、搜索词、店铺id、广告类别等,embedding大小均为8。

而模型采用4层的全连接神经网络,神经元个数分别为256,128,64和32,中间层的激活函数为Relu,输出层的激活函数为sigmoid。

2、模型分析

2.1 AUC和预测值分析

这里主要通过AUC来对模型的效果进行评价。下图展示了随着训练轮数的增加,训练集和8组测试集的AUC变化情况:

从整体上看,训练集的AUC不断提升,但是每组测试集的AUC都呈现先上升后下降的趋势,在210000步左右,测试集的AUC最高。在210000步以后,随着训练的进行,每组测试集的AUC不断降低,模型出现了过拟合现象。

再看一下不同的测试集,test1到test5的AUC呈现单调递减的情况,这也是符合预期的。随着测试集和训练集发生的天数间隔越大,二者的差别越大,模型的泛化能力逐渐减小。但到了test6到test8&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值