sklearn中决策树回归器DecisionTreeRegressor的实际应用及可视化

最新推荐文章于 2024-06-26 00:28:52 发布

白水baishui

最新推荐文章于 2024-06-26 00:28:52 发布

阅读量5.6k

点赞数 1

分类专栏： # 机器学习文章标签： sklearn 决策树分类 DecisionTreeRegressor 可视化

本文链接：https://blog.csdn.net/baishuiniyaonulia/article/details/89428483

版权

机器学习专栏收录该内容

20 篇文章

订阅专栏

假设有CSV文件(部分)：suzhou.csv
在这里插入图片描述
要对其进行回归分析并输出图像:

import numpy as np
from sklearn.tree import DecisionTreeRegressor
import matplotlib.pyplot as plt

data = np.genfromtxt("/suzhou.csv",delimiter=",",dtype=int,skip_header=1,usecols=np.arange(0,6))
data = data.transpose()

X = np.array(data[0]).reshape(len(data[0]),1)
y = np.array(data[4]).reshape(len(data[4]),1)

regr_1 = DecisionTreeRegressor(max_depth=2, presort=False)
regr_2 = DecisionTreeRegressor(max_depth=5, presort=False)
regr_1.fit(X, y)
regr_2.fit(X, y)

X_test = np.arange(2007, 2018, 0.9)[:, np.newaxis].astype(int)
y_1 = regr_1.predict(X_test)
y_2 = regr_2.predict(X_test)

x_axis = range(2007,2018,2)

plt.figure()
plt.scatter(X, y, s=20, edgecolor="black", c="darkorange", label="data")
plt.plot(X_test, y_1, color="cornflowerblue", label="Decision Tree Depth=2", linewidth=2)
plt.plot(X_test, y_2, color="yellowgreen", label="Decision Tree Depth=5", linewidth=2)
plt.xticks(x_axis)
plt.xlabel("Year")
plt.ylabel("Gross Industrial Output")
plt.title("Total Industrial Output Value of Enterprises in Suzhou")
plt.legend()
plt.show()