机器学习-随机森林温度预测模型优化

花菜回锅肉

已于 2024-04-17 18:21:42 修改

阅读量1.1k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习随机森林人工智能

于 2024-04-14 22:21:49 首次发布

本文链接：https://blog.csdn.net/hubuwch/article/details/137756315

文章目录

前言

在机器学习-随机森林算法预测温度一文中，通过增大模型训练数据集和训练特征的方式去优化模型的性能，本文将记录第三方种优化方式，通过调整随机森林创建模型参数的方式去优化模型，即调参。这里调参和神经网络使用验证集调整超参数概念不太一样，所以不会去使用验证集。本文调参，将使用RandomizedSearchCV（）函数，去交叉验证不同参数组合的模型性能，选择最优性能的参数组合模型。

旧模型训练

为了缩短参数训练的时间，对比旧模型，将先用部分数据 2016年的，不含ws_1、prcp_1、snwd_1三个特征值的，参见文章机器学习-随机森林算法预测温度

其评估结果如下：

误差是： 4.16
score： 0.843355562598595
MAE是: 4.16409589041096
MSE是: 26.98129152054795
RMSE是： 5.194351886477075

新模型训练

数据集和特征选择和旧模型保持一致，只通过调整模型构建参数进行调优。前面的数据探索性分析和数据预处理都一样。从构建模型开始，有了变化：

参数查看

# 建立随机森林模型
from sklearn.ensemble import RandomForestRegressor
# 建立预测模型
rf = RandomForestRegressor(random_state=42)
from pprint import pprint
# 格式化方式打印json数据
pprint(rf.get_params())