【数据分析】波士顿房价使用决策树中的regressor进行网格搜索交叉验证

蠢萌蠢萌的大兔子

已于 2022-09-21 14:34:13 修改

阅读量529

点赞数

分类专栏：练习日常文章标签：决策树机器学习 python

于 2022-09-21 14:28:12 首次发布

本文链接：https://blog.csdn.net/qq_35928550/article/details/126972084

版权

练习日常专栏收录该内容

4 篇文章 0 订阅

订阅专栏

日常的小练习，题目如下：

(1)   获取sklearn中波士顿房价boston数据
(2)   切分训练集和测试集
(3)   实例化决策树模型对象不传入超级参数 max_depth
(4)   使用网格搜索交叉验证寻找最优超级参数 max_depth，实例化对象是注意要传入三个参数参数 1.模型对象 2.超级参数的搜索范围 3.几折交叉验证
(5)   打印best_参数
(6)   打印best_score
(7)   使用最优超级参数，重新实例化模型对象，再重新训练模型

导包：

from sklearn.datasets import load_boston
from sklearn.model_selection import GridSearchCV, train_test_split
from sklearn.tree import DecisionTreeRegressor

代码部分：

# 获取sklearn中波士顿房价boston数据
data = load_boston()
x = data.data
y = data.target
# 切分训练集 和 测试集
train_x, test_x, train_y, test_y = train_test_split(x, y, test_size=0.2, shuffle=True)
# 实例化 决策树模型对象 不传入 超参数 max_depth
tree = DecisionTreeRegressor()
# 使用网格搜索交叉验证 寻找 最优超级参数 max_depth，实例化对象是注意要传入三个参数参数 1.模型对象 2.超级参数的搜索范围 3.几折交叉验证
params = {'max_depth': [5, 7, 9]}
model = GridSearchCV(estimator=tree, param_grid=params, cv=5)
model.fit(train_x, train_y)
# 打印best_参数
print(model.best_params_)
# 打印best_score
print(model.best_score_)
# 使用 最优超级参数 ，重新实例化 模型对象 ，再重新 训练模型
tree = DecisionTreeRegressor(max_depth=model.best_params_['max_depth'])
tree.fit(train_x, train_y)