决策树的剪枝（二）

最新推荐文章于 2024-02-25 19:34:16 发布

AI_Younger_Man

最新推荐文章于 2024-02-25 19:34:16 发布

阅读量182

点赞数

分类专栏： # 机器学习 Machine Learning

本文链接：https://blog.csdn.net/qq_38888209/article/details/108126632

版权

机器学习 Machine Learning 专栏收录该内容

31 篇文章 4 订阅

订阅专栏

在这里插入图片描述

这两个参数是在样本分布分厂不均衡的时候使用。
因为决策树天生喜欢向样本分类多的一部分数据偏移，所以版本比例不均衡的时候，权重参数需要调整。

# 决策树的剪枝  让决策树最大深度是3，可分支节点的样例数是20，切分之后子节点最少包涵10个
clf_05 = DecisionTreeClassifier(criterion='gini',
                                random_state=30,
                                splitter='random',
                                max_depth=3,
                                min_samples_leaf=10,
                                min_samples_split=20
                                )
clf_05 = clf_05.fit(x_train, y_train)
score_05 = clf_05.score(x_test, y_test)
print(score_05)  # 剪枝之后，分数有所提升


# 这么多的剪枝参数，如何选择呢？现在介绍一个简单的:就是使用for循环一一看图寻找
test = []
for i in range(10):
    clf = tree.DecisionTreeClassifier(max_depth=i+1
                                       ,criterion="entropy"
                                        ,random_state=30
                                        ,splitter="random"
                                    )
    clf = clf.fit(x_train, y_train)
    score = clf.score(x_test, y_test)
    test.append(score)
plt.plot(range(1, 11), test, color="red", label="max_depth")
plt.legend()
plt.show()

AI_Younger_Man

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
决策树的剪枝（二）

这两个参数是在样本分布分厂不均衡的时候使用。因为决策树天生喜欢向样本分类多的一部分数据偏移，所以版本比例不均衡的时候，权重参数需要调整。# 决策树的剪枝让决策树最大深度是3，可分支节点的样例数是20，切分之后子节点最少包涵10个clf_05 = DecisionTreeClassifier(criterion='gini', random_state=30, ...
复制链接

扫一扫

专栏目录