1.前言:本实验采用的是GSR数据,机器学习方法为随机森林
2.GSR数据如下图所示:
3.随机森林代码:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
a=pd.read_csv('F:/Pycharm/py/data/gsr_fea.csv')#读取数据
data=np.array(a)#将数据转换
#对数据做分割,data代表数据的名称、(21,)数据中前21行是特征标签赋值给x,最后一样是标签赋值给y
#axis = 1 代表按列进行分割
x,y = np.split(data, (21,), axis = 1)
#对数据进行划分为训练集、标签 测试级,标签。并且按照7:3划分。
x_train, x_test, y_train,y_test = train_test_split(x,y,test_size = 0.3)
# 将随机森林分类器实例化
clf2 = RandomForestClassifier(max_depth=8, min_samples_split=16, n_estimators=200)
clf2.fit(x_train,y_train) #输入训练集和标签到分类器中
#输入测试集进行评分
score=clf2.score(x_test, y_test)
print