自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

苏冉旭的专栏

机器学习、自然语言处理、搜索引擎排序

苏冉旭 CSDN认证博客专家 CSDN认证企业博客

码龄17年

18: 原创

18万+: 周排名

108万+: 总排名

7万+: 访问

: 等级

867: 积分

63: 粉丝

70: 获赞

33: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

tensorflow NAN常见原因和解决方法
skyous: 今天我也出现这个问题，发现有一张输入tensorflow为nan,原来归一化时max = min了导致异常，感谢提供灵感
GBDT（MART）迭代决策树入门教程 | 简介
苏冉旭: 感谢肯定~
GBDT（MART）迭代决策树入门教程 | 简介
夜半歌声丶: 看了这么多文章，这篇写的是真的好
GBDT（MART）迭代决策树入门教程 | 简介
苏冉旭: 1）gbdt相对于单颗树更不容易过拟合，主要原因和例子类似，就是通过boosting机制，在树的深度相对较小的前提下达到较好的拟合效果。即让每棵树在分裂时保持分类节点的instance都相对较多。而传统决策树算法，为了达到较小的训练集误差，只能不断增加树的深度来实现，就更容易过拟合。当然这是相对的，任何一个算法都无法硬性保证没有过拟合问题，这与训练集大小，特征多少，超参设置都是相关的。 2）GBDT的过拟合发现和任何算法的过拟合发现并没有什么不同。最直观的手段就是同时评估训练集指标与测试集指标，当训练集指标持续向好但测试集指标持续向差时，就发生了过拟合。通用做法是网格搜索，不过boosting tree的特点是树的数量是逐步累加的，通过观察截止不同树的数量时，两个集合指标变化情况，可以比较准确地找到这个时刻，这个倒是boosting算法独有的优势。 3）如果发生过拟合，首先考虑调整超参，减少每棵树的深度，减小learning rate，适度调整树的个数；同时考虑精简特征数量，增大训练集数量。
GBDT（MART）迭代决策树入门教程 | 简介
applicatee2: 很舒服，有几个问题想问： 1）GBDT也有过拟合的问题吧？按照举的例子看是没有，但是每颗树在生长过程中不可避免的有过拟合吧（根据设置的每颗树的深度） 2）GBDT的过拟合怎么发现，怎么处理呢？

最新文章

机器学习

关注

文章平均质量分 78

关注数：文章数：7 文章阅读量：51128 文章收藏量：126

作者: 苏冉旭

这个作者很懒，什么都没留下…

展开