scikit-learn决策树算法中特征重要性的计算

最新推荐文章于 2024-01-09 14:08:46 发布

TravelingLight77

最新推荐文章于 2024-01-09 14:08:46 发布

阅读量1.6k

点赞数 1

分类专栏： ML

原文链接：https://blog.csdn.net/DKY10/article/details/84843864?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~top_click~default-1-84843864.nonecase&utm_term=%E5%86%B3%E7%AD%96%E6%A0%91%E8%BE%93%E5%87%BA%E7%89%B9%E5%BE%81%E9%87%8D%E8%A6%81%E6%80

版权

ML 专栏收录该内容

43 篇文章 6 订阅

订阅专栏

在这里插入图片描述
其中，N是样本的总数，N_t是当前节点的样本数目，N_t_L是结点左孩子的样本数目，N_t_R是结点右孩子的样本数目。impurity直译为不纯度（基尼指数或信息熵），这里的实现的是基尼指数。
举个例子，下面的决策树

from StringIO import StringIO

from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.tree.export import export_graphviz
from sklearn.feature_selection import mutual_info_classif

X = [[1,0,0], [0,0,0], [0,0,1], [0,1,0]]

y = [1,0,1,1]

clf = DecisionTreeClassifier()
clf.fit(X, y)

feat_importance = clf.tree_.compute_feature_importances(normalize=False)
print("feat importance = " + str(feat_importance))

out = StringIO()
out = export_graphviz(clf, out_file='test/tree.dot')

该决策树的图示如下：

在这里插入图片描述

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TravelingLight77

关注关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn决策树算法中特征重要性的计算

sklearn.tree.DicisionTreeClassifier类中的feature_importances_属性返回的是特征的重要性，feature_importances_越高代表特征越重要，scikit-learn官方文档1中的解释如下： The importance of a feature is computed as the (normalized) total reduction of the c...
复制链接

扫一扫