手把手教你用scikit-learn决策树算法库画出决策树

最新推荐文章于 2022-08-13 17:23:41 发布

akirameiao

最新推荐文章于 2022-08-13 17:23:41 发布

阅读量3.8k

点赞数

分类专栏：机器学习文章标签：机器学习决策树 sklearn 分类回归

本文链接：https://blog.csdn.net/akirameiao/article/details/79958927

版权

本文手把手教你如何使用scikit-learn的DecisionTreeClassifier和DecisionTreeRegressor进行分类与回归，并介绍参数设置、可视化技巧及防止过拟合的方法，包括调整max_depth、min_samples_split和min_samples_leaf，以及利用class_weight处理类别不平衡问题。

摘要由CSDN通过智能技术生成

想了解决策树的原理，可以看我关于决策树理论的介绍

参数的介绍

共同参数	含义
max_depth	决策树最大深度：默认可以不输入，决策树在生成的时候不会限制树的深度。一般来说，数据少或者特征少的时候可以不管这个值。如果模型样本量多，特征也多的情况下，推荐限制这个最大深度，具体的取值取决于数据的分布。常用的可以取值10-100之间。
max_features	划分时考虑的最大特征数：默认是”None”,意味着划分时考虑所有的特征数。可以使用很多种类型的值，如果是”log2”意味着划分时最多考虑 $log_2N$