python实现决策树与随机森林

最新推荐文章于 2024-04-29 10:06:27 发布

Soybean11

最新推荐文章于 2024-04-29 10:06:27 发布

阅读量562

点赞数

文章标签： python 决策树代码

本文链接：https://blog.csdn.net/csefrfvdv/article/details/100188242

版权

数据来自于sklearn.datasets中的load_iris

模型为决策树

import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt
import matplotlib as mpl

iris=load_iris()
print(iris.data.shape)
data=pd.DataFrame(iris.data,columns=iris.feature_names)  #pd.DataFrame(A,index='',columns='')
data['target']=iris.target
x=data.iloc[:,:-2]   #从pandas中的DataFrame中截取数据，需要用.iloc
y=data.iloc[:,-1:]
x_train,x_test,y_train,y_test=train_test_split(x,y,train_size=0.75,random_state=40)
tree_clf=DecisionTreeClassifier(max_depth=5,criterion='entropy')
tree_clf.fit(x_train,y_train)
y_predict=tree_clf.predict(x_test)
print('acc',accuracy_score(y_test,y_predict))

模型为随机森林

import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

iris=load_iris()
data=pd.DataFrame(iris.data,columns=iris.feature_names)
data['target']=iris.target

x=data.iloc[:,:-1]
y=data.iloc[:,-1:]

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.75,random_state=40)
random_forest=RandomForestClassifier(n_estimators=20,max_leaf_nodes=16,n_jobs=20)   #max_leaf_nodes 最大叶节点数，与max_depth选一即可
random_forest.fit(x_train,y_train)
y_predict=random_forest.predict(x_test)
p=accuracy_score(y_test,y_predict)
print(p)

Soybean11

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python实现决策树与随机森林

数据来自于sklearn.datasets中的load_iris模型为决策树import pandas as pdimport numpy as npfrom sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.tree import Dec...
复制链接

扫一扫