本文介绍的论文题目为:《Visualizing and Understanding Deep Neural Networks in CTR Prediction》
论文下载地址为:https://arxiv.org/abs/1806.08541
本文从预测值、神经元状态、特征梯度强度等几个方面入手,对点击率预估模型进行了可视化分析,一起来了解一下。
1、数据集介绍
先介绍一下本文使用的数据集,本文使用的数据是阿里广告平台收集到的日志数据。一共有8天,训练集从第一天的数据中采样得到,而测试集按天进行采样,每天的测试集作为单独的一组(test1代表第一天的测试集,test2代表第二天的测试集,依次类推),并且第一天的测试集和训练集没有交叉。
输入特征共有34组离散特征,如用户id、用户所在城市id、用户性别、用户年龄分集、搜索词、店铺id、广告类别等,embedding大小均为8。
而模型采用4层的全连接神经网络,神经元个数分别为256,128,64和32,中间层的激活函数为Relu,输出层的激活函数为sigmoid。
2、模型分析
2.1 AUC和预测值分析
这里主要通过AUC来对模型的效果进行评价。下图展示了随着训练轮数的增加,训练集和8组测试集的AUC变化情况:
从整体上看,训练集的AUC不断提升,但是每组测试集的AUC都呈现先上升后下降的趋势,在210000步左右,测试集的AUC最高。在210000步以后,随着训练的进行,每组测试集的AUC不断降低,模型出现了过拟合现象。
再看一下不同的测试集,test1到test5的AUC呈现单调递减的情况,这也是符合预期的。随着测试集和训练集发生的天数间隔越大,二者的差别越大,模型的泛化能力逐渐减小。但到了test6到test8&