sklearn随机森林展示各个特征权重

最新推荐文章于 2024-05-01 00:11:55 发布

呆萌的代Ma

最新推荐文章于 2024-05-01 00:11:55 发布

阅读量6.7k

点赞数 3

分类专栏： python 文章标签： sklearn

本文为CSDN博主"呆萌的代Ma"原创文章，转载请注明博客链接：https://blog.csdn.net/weixin_35757704/

本文链接：https://blog.csdn.net/weixin_35757704/article/details/112853529

版权

python 同时被 2 个专栏收录

593 篇文章 40 订阅

订阅专栏

人工智能

28 篇文章 2 订阅

订阅专栏

核心代码

使用 feature_importances_可以提取随机森林的特征排序

rf_model.feature_importances_

案例

创建数据：

import pandas as pd
import numpy as np

x = pd.DataFrame(np.random.randint(0,100,size=(50, 3)))
y = pd.DataFrame(np.random.randint(0,5,size=(50, 1)))

切分训练集与测试集：

from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3)

训练随机森林模型：

from sklearn.ensemble import RandomForestRegressor
 
rf_model = RandomForestRegressor(n_estimators=100)
rf_model.fit(x_train,y_train)

随机森林训练后的特征重要性提取：

predict = rf_model.predict(x_test)
features = x.columns
feature_importances = rf_model.feature_importances_
features_df = pd.DataFrame({'Features':features,'Importance':feature_importances})
features_df.sort_values('Importance',inplace=True,ascending=False)

重要性的排序：

features_df

绘图：

import seaborn as sns
import matplotlib.pyplot as plt

sns.set(rc={"figure.figsize": (21, 4)})
sns.barplot(features_df['Features'][:10], features_df['Importance'][:10],)
plt.ylabel('Word count')
# 数据可视化：柱状图
sns.despine(bottom=True)
plt.show()

呆萌的代Ma

关注

3
点赞
踩
51

收藏

觉得还不错? 一键收藏
打赏
5
评论
sklearn随机森林展示各个特征权重

核心代码使用 feature_importances_可以提取随机森林的特征排序rf_model.feature_importances_案例创建数据：import pandas as pdimport numpy as npx = pd.DataFrame(np.random.randint(0,100,size=(50, 3)))y = pd.DataFrame(np.random.randint(0,5,size=(50, 1)))切分训练集与测试集：from sklearn
复制链接

扫一扫