【Python】多分类算法—Random Forest
本文将主要就Random Forest(随机森林)的多分类应用进行描述,当然也可运用于二分类中。本文运用scikit-learn框架。
文章目录
一、导入基础库
导入数据处理和绘图的相关库,为使层次更加分明,将在后面再导入scikit-learn框架。
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
二、数据读取及处理
1.数据读取
从csv文件中读取设备数据,代码如下:
# 读取数据
dataset = pd.read_csv('test_data.csv')
print(dataset)
数据形式大概如下,x为设备数据,class为数据特征,这里分为三类:
(真实数据不便展示,截图只是做展示,这里可下载iris鸢尾花数据集https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data)
2.数据处理
接下来进行数据预处理,将x作为自变量X,class作为自变量y。
# 数据预处理 选择自变量x 因变量y
X = dataset.iloc[: