决策树、随机森林、逻辑回归、SVM、XGBoost重要参数

最新推荐文章于 2024-06-28 14:18:40 发布

Guiabbey

最新推荐文章于 2024-06-28 14:18:40 发布

阅读量3.6k

点赞数 3

文章标签：调参决策树随机森林 svm XGBoost

本文链接：https://blog.csdn.net/Guiabbey/article/details/90369269

版权

本文详细介绍了决策树、随机森林、逻辑回归、SVM和XGBoost的重要参数，包括各自的调参技巧和常用参数设置。例如，决策树的criterion、max_depth、n_estimators等；随机森林的n_estimators、random_state和bootstrap等；逻辑回归的penalty和C参数；SVM的核函数选择和C参数；XGBoost的n_estimators、eta、gamma和正则化参数等。通过理解这些参数，可以更好地优化模型性能。

摘要由CSDN通过智能技术生成

一、决策树

在这里插入图片描述
分类树的8个重要参数：criterion、2个随机性相关的参数（random_state,splitter）、5个剪枝参数（max_depth、min_samples_split、min_samples_leaf、max_feature、min_impurity_decrease）。
1、criterion：不纯度计算方法，信息熵entropy和基尼系数gini，默认gini。
2、random_state:设置分枝中随机模式的参数，默认为None。
3、splitter:控制决策树中的随机选项。best和random,默认最佳分枝best(分枝虽随机，但会优先选择更重要的特征分枝)。
4、max_depth:树大最大深度，建议从3开始尝试。
5、min_samples_split:一个节点至少包含min_samples_split个训练样本，默认为2。
6、min_samples_leaf:一个节点在分枝后的每个子节点都必须包含min_samples_leaf个训练样本，建议从5开始尝试。
7、max_features:限制分枝时考虑的特征个数（和max_depth异曲同工）。
8、min_impurity_decrease:限制信息增溢的大小，信息增溢小于设定数值的分枝不会发生。

网格搜索调参

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV
times = time()
parameters = {
   'splitter':('best','random')
             ,'criterion':("gini","entropy")
             ,"max_depth":[*range(1,10)]
             ,'min_samples_leaf':[*range(1,50,5)]
             ,'min_impurity_decrease':[*np.linspace(0,0.5,20)]
             }
clf = DecisionTreeClassifier(random_state=25)
GS

最低0.47元/天解锁文章

Guiabbey

关注

3
点赞
踩
48

收藏

觉得还不错? 一键收藏
0
评论
决策树、随机森林、逻辑回归、SVM、XGBoost重要参数

决策树、随机森林、逻辑回归、SVM、XGBoost重要参数一、决策树二、随机森林三、逻辑回归四、SVM五、XGBoost一、决策树分类树的8个重要参数：criterion、2个随机性相关的参数（random_state,splitter）、5个剪枝参数（max_depth、min_samples_split、min_samples_leaf、max_feature、min_impurity_...
复制链接

扫一扫