python绘制随机森林重要度排序条形图,以及把重要度之和前0.9显示出来,用于观察
前面的话:因为项目原因,需要特征选择,随机森林有自带的重要度属性,但是我需要观察前0.9(此处理解为能包含重要度之和为0.9的前几项特征为比较重要的,例如:20个特征可以包含重要度之和0.9,八个特征包含重要度0.1,那么可以把这8个进行筛选)
先附上绘制后的条新图(因为项目保密性,具体特征只截取部分名称,横坐标是重要度,纵坐标是特征名称):
对这个图简单说明一下:
1.横坐标是重要度,纵坐标是特征名称
2.按照重要度排序,蓝色为末尾重要度之和为0.1的特征,红色为余下0.9的特征,在此也就可以理解为最重要部分
3.每一条重要度后都加了标签用于显示具体数值
下面附上代码:(一个函数)
def plot_feature_importances(feature_importances,title,feature_names,change):
print('feature_importances',feature_importances)
print('names',feature_names)
# feature_importances = 100.0*(feature_importances/max(feature_importances))
# print('feature_importances',feature_impo