1.随机森林回归
1.1数据集
此处采用波士顿房价数据集(可直接调用),训练特征为13个,输出标签为MEDV。
数据截图如下,
1.2 代码实现
from sklearn.ensemble import RandomForestRegressor
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False
# 导入波士顿房价数据集
from sklearn.datasets import load_boston
X, y = load_boston(return_X_y=True)
# 建立随机森林回归模型
rf = RandomForestRegressor()
# 前450条数据作为训练集
rf.fit(X[0:450, :], y[0:450])
# 后56条数据作为测试集
test = X[450:506, :]
# 绘图
x = np.arange(56)
plt.scatter(x, y[450:], s=10, label="实际数据点",)
plt.plot(x, rf.predict(test), c='r', label="随机森林回归拟合数据")
plt.xlabel("样本")
plt.ylabel("MEDV")
plt.grid()
plt.legend()
plt.show()