python决策树export_python – 了解export_graphviz的决策树输出

最新推荐文章于 2023-08-08 14:15:15 发布

weixin_39806779

最新推荐文章于 2023-08-08 14:15:15 发布

阅读量2.7k

点赞数

文章标签： python决策树export

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39806779/article/details/111755434

版权

问题设置：我有一个不平衡的数据集,其中98％的数据属于A类,2％属于B类.我训练了一个DecisionTreeClassifier(来自sklearn),class_weights设置为与以下设置平衡：

dtc_settings = {

'criterion': 'entropy',

'min_samples_split': 100,

'min_samples_leaf': 100,

'max_features': 'auto',

'max_depth': 5,

'class_weight': 'balanced'

}

我没有理由将标准设置为熵(而不是基尼).我只是玩弄设置.

我使用tree的export_graphviz来获取下面的决策树图.这是我使用的代码：

dot_data = tree.export_graphviz(dtc, out_file=None, feature_names=feature_col, proportion=False)

graph = pydot.graph_from_dot_data(dot_data)

graph.write_pdf("test.pdf")

我对下图中的值列表输出感到困惑：

值列表变量是否意味着两个类具有相同的权重？如果是这样,如何为树中的后续节点计算值列表？

这是另一个我在export_graphviz中将比例设置为True的示例：

我不知道如何解释价值表.条目类权重？这是否意味着分类器分别将这些权重应用于每个类以确定下一个节点中要使用的下一个阈值？

最佳答案该列表表示每个类中已到达该节点的记录数.根据您组织目标变量的方式,第一个值表示到达该节点的类型A的记录数,第二个值表示到达该节点的类型B的记录数(反之亦然).

当proportion设置为True时,它现在是已到达该节点的每个类的记录的一部分.

决策树的工作方式是它试图找到最能隔离类的决策.所以它更喜欢那些会导致类似[0,100]的决定导致[50,50]

weixin_39806779

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。