决策树参数调优建议

最新推荐文章于 2024-07-31 07:39:23 发布

枫-麟

最新推荐文章于 2024-07-31 07:39:23 发布

阅读量9.1k

点赞数 4

分类专栏：人工智能机器学习理论

本文链接：https://blog.csdn.net/evolution23/article/details/85253992

版权

人工智能同时被 2 个专栏收录

16 篇文章

订阅专栏

机器学习理论

2 篇文章

订阅专栏

建议一：

三个最重要的参数为:树的数目、树的深度和学习率。建议参数调整策略为:
– 采用默认参数配置试试
– 如果系统过拟合了,降低学习率
– 如果系统欠拟合,加大学习率

建议二：

– n_estimators和learning_rate:固定n_estimators为100(数目不大，因为树的深度较大,每棵树比较复杂),然后调整learning_rate
– 树的深度max_depth:从6开始,然后逐步加大
– min_child_weight : 1 ⁄ sqrt rare_events ,其中rare_events 为稀有事件的数目
– 列采样colsample_bytree/ colsample_bylevel:在[0.3, 0.5]之间进行网格搜索
– 行采样subsample:固定为1
– gamma: 固定为0.0

建议三：

• 1. 选择较高的学习率(learning rate),并选择对应于此学习率的理想的树的数量
– 学习率以工具包默认值为0.1。
– XGBoost直接引用函数“cv”可以在每一次迭代中使用交叉验证,并返回理想的树数量(因为交叉验证很慢，所以可以import两种XGBoost；直接引用xgboost(用“cv”函数调整树的数目)和XGBClassifier —xgboost的sklearn包(用GridSearchCV调整其他参数 )。
• 2. 对于给定的学习率和树数量,进行树参数调优( max_depth,min_child_weight, gamma, subsample, colsample_bytree, colsample_bylevel )
• 3. xgboost的正则化参数(lambda, alpha)的调优
• 4. 降低学习率,确定树的数目参数