机器学习训练营XGBoost优缺点及重要参数学习笔记

Yuuki819

已于 2022-03-31 09:32:58 修改

阅读量6.9k

点赞数 2

文章标签： python

于 2022-03-31 09:24:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_68284316/article/details/123862713

版权

本文介绍了机器学习中XGBoost的主要优点，如易用性、高效性和鲁棒性，以及其在处理高维数据和深度学习模型对比时的不足。文章深入探讨了XGBoost的重要参数，包括eta、min_child_weight、max_depth等，解释了它们的作用和调整的影响，并在结尾提及了在类别不平衡场景下如何优化。

摘要由CSDN通过智能技术生成

一.学习知识点概要:

XGBoost优缺点及重要参数
XGBoost的主要优点：
XGBoost主要缺点
XGBoost重要参数

二.学习内容：

XGBoost的主要优点：
简单易用。相对其他机器学习库，用户可以轻松使用XGBoost并获得相当不错的效果。
高效可扩展。在处理大规模数据集时速度快效果好，对内存等硬件资源要求不高。
鲁棒性强。相对于深度学习模型不需要精细调参便能取得接近的效果。
XGBoost内部实现提升树模型，可以自动处理缺失值。
XGBoost主要缺点
相对于深度学习模型无法对时空位置建模，不能很好地捕获图像、语音、文本等高维数据。
在拥有海量训练数据，并能找到合适的深度学习模型时，深度学习的精度可以遥遥领先XGBoost。
XGBoost重要参数
1.eta[默认0.3]
通过为每一颗树增加权重，提高模型的鲁棒性。
典型值为0.01-0.2。

2.min_child_weight[默认1]
决定最小叶子节点样本权重和。
这个参数可以避免过拟合。当它的值较大时，可以避免模型学习到局部的特殊样本。
但是如果这个值过高，则会导致模型拟合不充分。

3.max_depth[默认6]
这个值也是用来避免过拟合的。max_depth越大，模型会学到更具体更局部的样本。
典型值：3-10

4.max_leaf_nodes
树上最大的节点或叶子的数量。
可以替代max_depth的作用。
这个参数的定义会导致忽略max_depth参数。

5.gamma[默认0]
在节点分裂时，只有分裂后损失函数的值下降了，才会分裂这个节点。Gamma指

最低0.47元/天解锁文章

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
机器学习训练营XGBoost优缺点及重要参数学习笔记

XGBoost优缺点及重要参数XGBoost的主要优点：XGBoost主要缺点XGBoost重要参数XGBoost的主要优点：简单易用。相对其他机器学习库，用户可以轻松使用XGBoost并获得相当不错的效果。高效可扩展。在处理大规模数据集时速度快效果好，对内存等硬件资源要求不高。鲁棒性强。相对于深度学习模型不需要精细调参便能取得接近的效果。XGBoost内部实现提升树模型，可以自动处理缺失值。XGBoost主要缺点相对于深度学习模型无法对时空位置建模，不能很好地捕获图像、语音、文本等
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。