【无标题】

最新推荐文章于 2024-07-11 18:01:45 发布

山河好大765

最新推荐文章于 2024-07-11 18:01:45 发布

阅读量687

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/shanhehaoda_/article/details/122954346

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

RandomForestClassifier算法对特征值筛选的应用

# -*- coding: utf-8 -*-
"""
Created on Tue Feb 15 22:07:32 2022

@author: 17584
随机森林
"""
import pandas as pd
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'
df = pd.read_csv(url,header= None) #读入csv文件
df.columns=map(str,[i for i in range(1,15)]) #对列名进行定义

from sklearn.model_selection import train_test_split 
from sklearn.ensemble import RandomForestClassifier
x,y = df.iloc[:,1:].values,df.iloc[:,0].values #x特征值 y目标值

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.3,random_state=0)
#特征值变量的名称
feat_labels = df.columns[1:]
#生成随机森林
forest = RandomForestClassifier(n_estimators=10000,random_state=0,n_jobs=-1) #调整参数
forest.fit(x_train,y_train) 
#获取特征值的重要程度
importances = forest.feature_importances_

import numpy as np

np.unique(df['1'])
indices = np.argsort(importances)[::-1] #按重要度进行排序（降序）
for f in range(x_train.shape[1]):
   print('(%.2d)%-*s %f' % (f + 1,30,feat_labels[indices[f]],importances[indices[f]]))
   #按重要程度排序进行打印
import matplotlib.pyplot as plt #绘图
plt.title('Feature Importance') #标题
plt.bar(range(x_train.shape[1]),importances[indices],color='lightblue',align='center') #bar图
plt.xticks(range(x_train.shape[1]),feat_labels,rotation=90) #x轴
plt.xlim([-1,x_train.shape[1]]) #x轴最小值与最大值
plt.tight_layout()  #自动调整参数使图像布满整个区域
plt.show( )

山河好大765

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【无标题】

RandomForestClassifier算法对特征值筛选的应用# -*- coding: utf-8 -*-"""Created on Tue Feb 15 22:07:32 2022@author: 17584随机森林"""import pandas as pdurl = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'df = pd.read_csv(url,header= None
复制链接

扫一扫