python决策树二分类_【Python机器学习】scikit-learn——决策树分类（二）

最新推荐文章于 2024-07-03 11:24:00 发布

马未都

最新推荐文章于 2024-07-03 11:24:00 发布

阅读量921

点赞数

文章标签： python决策树二分类

本文链接：https://blog.csdn.net/weixin_42116734/article/details/113506361

版权

本文详细介绍了使用scikit-learn库构建决策树分类器的参数，包括criterion、splitter、max_depth、min_samples_split、min_samples_leaf等，并提供了乳腺癌数据集的实例，展示了如何评估特征重要性和模型性能。

摘要由CSDN通过智能技术生成

class sklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2,min_samples_leaf =1, min_weight_fraction_leaf=0.0,max_features=None, random_state=None, max_leaf_nodes=None,class_weight=None, presort=False)

[1]特征选择标准criterion：string类型，可以使用"gini"或者"entropy"，前者代表基尼系数，后者代表信息增益。一般说使用默认的基尼系数"gini"就可以了，即CART算法。除非你更喜欢类似ID3, C4.5的最优特征选择方法。

[2]特征划分点选择标准splitter：string类型，可以使用"best"或者"random"。前者在特征的所有划分点中找出最优的划分点。后者是随机的在部分划分点中找局部最优的划分点。默认的"best"适合样本量不大的时候，而如果样本数据量非常大，此时决策树构建推荐"random"

[3]划分时考虑的最大特征数max_features：int,float,string or None。可以使用很多种类型的值，默认是"None"意味着划分时考虑所有的特征数；如果是"log2"意味着划分时最多考虑log2N个特征；如果是"sqrt"或者"auto"意味着划分时最多考虑N^(1/2)个特征。如果是整数，代表考虑的

最低0.47元/天解锁文章

马未都

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python决策树二分类_【Python机器学习】scikit-learn——决策树分类（二）

class sklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2,min_samples_leaf =1, min_weight_fraction_leaf=0.0,max_features=None, random_state=None,...
复制链接

扫一扫