DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks
Guolin Ke, Zhenhui Xu, Jia Zhang, Jiang Bian, Tie-Yan Liu
Microsoft Research, Peking University
KDD 2019
http://delivery.acm.org/10.1145/3340000/3330858/p384-ke.pdf
在线预测在很多实际应用中起着非常重要的作用。典型在线预测任务有两个特点,其一即为表格形式的输入空间,其二即为在线的数据生成。表格形式的输入空间,意味着其中既有比较稀疏的类别型特征,又有比较稠密的数值型特征;在线的数据生成,暗含着任务以指数动态分布的形式产生连续的数据。
既能比较有效的处理表格形式的输入空间,又可以比较快的自适应到在线的数据生成中,成为在线预测模型中的两大重要挑战。虽然梯度提升决策树(GBDT)和神经网络在实际中广泛应用,但是二者皆有其劣势。比如,GBDT很难应用于线上动态生成的数据,而且在应对比较稀疏的特征时很难取得较好的效果;同时,对于神经网络,该模型在应对稠密数值特征时很难取得好效果。
本文提出一种新的学习框架,DeepGBM,该框架能够集成神经网络和GBDT的优势,其中包含了两种神经网络,一种是CatNN,这种网络集中处理稀疏类别型特征,另一种是GBDT2NN,这种模型集