线性回归、bagging回归、随机森林回归

最新推荐文章于 2025-04-15 16:33:46 发布

我才是阿鑫

最新推荐文章于 2025-04-15 16:33:46 发布

阅读量2.8w

点赞数 4

分类专栏：机器学习文章标签：线性回归 bagging回归随机森林回归

本文链接：https://blog.csdn.net/zhaiax672/article/details/80459543

版权

本文探讨了线性回归、bagging回归和随机森林回归。通过对决策树的运用，展示了线性回归和决策树在均方误差（MSE）和R²上的表现。并解释了bagging和随机森林的原理，强调随机森林中每棵树的生长策略和预测结果的平均化过程，以提高模型对数据的代表性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

决策树

import pandas as pd
import numpy as np
import graphviz
from sklearn.tree import DecisionTreeRegressor
from sklearn import tree

X = np.array(data[['C', 'E']])  # Create an array
y = np.array(data['NOx'])

regt = DecisionTreeRegressor(max_depth=4)

regt = regt.fit(X, y)  # Build a decision tree regressor from the training set (X, y)

dot_data = tree.export_graphviz(regt, out_file=None)  # Export a decision tree in DOT format

graph = graphviz.Source(dot_data)

graph.render("tree")  # Save the source to file

这里写图片描述
[注]

节点属性：

X[1]：X = np.array(data[['C', 'E']])中的E列，为特征值
samples：样本的数量
mse：均方误差（mean-square error, MSE）是反映估计量与被估计量之间差异程度的一种
value：平均值

print(regt.score(X, y))
------------------------------------
0.949306568162

regt1 = regt.fit(X[:, 1].reshape(-1, 1), y)  # reshape(-1, 1) 将数组改为 多行1列

dot_data = tree.export_graphviz(regt, out_file=None)

graph = graphviz.Source(dot_data)

graph.render("tree1")

regt1.score(X[:, 1].reshape(-1, 1), y)

这里写图片描述

对比过后，发现 tree 和 tree1 完全相同

u = np.sort(np.unique(X[:, 1]))
t = np.diff(u)/2+u[:-1]  # diff() 后一个元素减去前一个

最低0.47元/天解锁文章