深度 | 蚂蚁金服DASFAA论文带你深入了解GBDT模型

最新推荐文章于 2024-03-22 15:00:33 发布

煊琰

最新推荐文章于 2024-03-22 15:00:33 发布

阅读量1.9k

点赞数

小蚂蚁说：

2018年5月21日，国际顶级数据库会议DASFAA 2018（International Conference on Database Systems for Advanced Applications）在澳大利亚黄金海岸举办。

本文是蚂蚁金服录用于DASFAA的论文Unpack Local Model Interpretation for GBDT（作者：方文静、周俊、李小龙、朱其立）的简要介绍。

我有几张阿里云幸运券分享给你，用券购买或者升级阿里云相应产品会有特惠惊喜哦！把想要买的产品的幸运券都领走吧！快下手，马上就要抢光了。

GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力（generalization)较强的算法，近些年更因为被用于搜索排序的机器学习模型而引起大家关注。

GBDT模型自被提出以来，一直在有监督的机器学习任务中扮演重要角色，在各种机器学习算法竞赛中数见不鲜，因此对其应用的算法业务中对模型结果解释的需求也日益增加。本文设计并解释了一种GBDT模型行之有效的局部解释性方案。

b89d89fe4cd809f58f96344e4c842648667ac719

引言

GBDT(Gradient Boosting Decision Tree)模型自被提出以来，一直在有监督的机器学习任务中扮演重要角色，在各种机器学习算法竞赛中数见不鲜。GBDT是一系列决策树弱分类器的集成，将所有决策树的分值相加获得最终预测结果，由于这种集成方法的本质，GBDT在众多问题中具有较优的表现，因此吸引了研究者们对算法进行不断优化，出现不同的变式。树形模型虽然在诸多任务上取得比线性模型更好的效果，但线性模型的一大优势在于天然能提供特征重要性的评判，因此在一些需要模型解释的场景，树形模型的应用受到了局限。本文关注为GBDT模型及其各种变式，提供一种统一的局部解释方案，对每一个预测样本可以给出各个特征的贡献度，从而对模型预测结果进行归因。

原文链接