日常的小练习,题目如下:
(1) 获取sklearn中波士顿房价boston数据
(2) 切分训练集 和 测试集
(3) 实例化 决策树模型对象 不传入 超级参数 max_depth
(4) 使用网格搜索交叉验证 寻找 最优超级参数 max_depth,实例化对象是注意要传入三个参数参数 1.模型对象 2.超级参数的搜索范围 3.几折交叉验证
(5) 打印best_参数
(6) 打印best_score
(7) 使用 最优超级参数 ,重新实例化 模型对象 ,再重新 训练模型
导包:
from sklearn.datasets import load_boston
from sklearn.model_selection import GridSearchCV, train_test_split
from sklearn.tree import DecisionTreeRegressor
代码部分:
# 获取sklearn中波士顿房价boston数据
data = load_boston()
x = data.data
y = data.target
# 切分训练集 和 测试集
train_x, test_x, train_y, test_y = train_test_split(x, y, test_size=0.2, shuffle=True)
# 实例化 决策树模型对象 不传入 超参数 max_depth
tree = DecisionTreeRegressor()
# 使用网格搜索交叉验证 寻找 最优超级参数 max_depth,实例化对象是注意要传入三个参数参数 1.模型对象 2.超级参数的搜索范围 3.几折交叉验证
params = {'max_depth': [5, 7, 9]}
model = GridSearchCV(estimator=tree, param_grid=params, cv=5)
model.fit(train_x, train_y)
# 打印best_参数
print(model.best_params_)
# 打印best_score
print(model.best_score_)
# 使用 最优超级参数 ,重新实例化 模型对象 ,再重新 训练模型
tree = DecisionTreeRegressor(max_depth=model.best_params_['max_depth'])
tree.fit(train_x, train_y)