四种不同机器学习方法(线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型)对光伏发电预测

1.数据集介绍(可以看短期光伏发电量短期预测(Python代码,基于LSTM模型)_深度学习的奋斗者的博客-CSDN博客

两篇文章用的是同一个数据集,不同的的是本篇多了温度特征。

只对数据集感兴趣的可以关注:https://blog.csdn.net/qq_40840797/article/details/131842873

这些是温度数据集中的列名:

  • DATE_TIME: 日期和时间
  • PLANT_ID: 电厂ID
  • SOURCE_KEY: 数据源的关键字
  • AMBIENT_TEMPERATURE: 环境温度
  • MODULE_TEMPERATURE: 模块温度
  • IRRADIATION: 辐照度

这些列包含了太阳能发电数据和气象传感器数据的各个指标和变量。

2020/5/15 0:004135001HmiyD2TTLFNqkNe25.1843161322.85750740
2020/5/15 0:154135001HmiyD2TTLFNqkNe25.0845886722.761667870
2020/5/15 0:304135001HmiyD2TTLFNqkNe24.935752622.592305530
2020/5/15 0:454135001HmiyD2TTLFNqkNe24.846130422.360852130
2020/5/15 1:004135001HmiyD2TTLFNqkNe24.6215253622.165422640
2020/5/15 1:154135001HmiyD2TTLFNqkNe24.536092221.968570870
2020/5/15 1:304135001HmiyD2TTLFNqkNe24.6386738722.352925670
2020/5/15 1:454135001HmiyD2TTLFNqkNe24.8730223323.16091920
2020/5/15 2:004135001HmiyD2TTLFNqkNe24.9369304723.0261130
2020/5/15 2:154135001HmiyD2TTLFNqkNe25.012247623.343229270
2020/5/15 2:304135001HmiyD2TTLFNqkNe25.0051493323.639459270
2020/5/15 2:454135001HmiyD2TTLFNqkNe24.9930195324.03948580
2020/5/15 3:004135001HmiyD2TTLFNqkNe25.0163094324.384135570
2020/5/15 3:154135001HmiyD2TTLFNqkNe24.9852152724.351507730
2020/5/15 3:304135001HmiyD2TTLFNqkNe24.9377319324.060296530
2020/5/15 3:454135001HmiyD2TTLFNqkNe24.8790995323.709794130
2020/5/15 4:004135001HmiyD2TTLFNqkNe24.678902222.589941530
2020/5/15 4:154135001HmiyD2TTLFNqkNe24.351930821.783642530
2020/5/15 4:304135001HmiyD2TTLFNqkNe24.062622221.852524930
2020/5/15 4:454135001HmiyD2TTLFNqkNe24.013224222.3063150
2020/5/15 5:004135001HmiyD2TTLFNqkNe24.177105822.551908470
2020/5/15 5:154135001HmiyD2TTLFNqkNe24.30488822.979492070
2020/5/15 5:304135001HmiyD2TTLFNqkNe24.3287272723.452380470
2020/5/15 5:454135001HmiyD2TTLFNqkNe24.2892111323.096691930.000862721
2020/5/15 6:004135001HmiyD2TTLFNqkNe24.0884460722.20675660.005886957

2.代码流程

  1. 导入所需的库,包括numpy、pandas、seaborn和matplotlib.pyplot。
  2. 读取两个CSV文件的数据,分别是'Plant_1_Generation_Data.csv'(发电相关信息)和'Plant_1_Weather_Sensor_Data.csv'(温度相关信息),存储到两个DataFrame变量中。
  3. 打印一些数据统计信息,如唯一值的数量和数据的概要。
  4. 将日期时间列转换为datetime类型。
  5. 使用pd.merge函数将两个数据集按照日期时间进行合并,生成一个新的DataFrame df。
  6. 检查并打印df中的缺失值情况。
  7. 绘制df中各个变量之间的散点图矩阵。
  8. 使用LabelEncoder对SOURCE_KEY列进行编码。
  9. 创建一个新的DataFrame df_ml作为机器学习模型的输入数据,并选择特征变量X和目标变量y。
  10. 计算特征变量X之间的相关性,并使用相关性矩阵进行可视化。
  11. 将数据集拆分为训练集和测试集。
  12. 使用线性回归模型进行训练和预测,并计算模型的得分。
  13. 使用K近邻回归模型进行训练和预测,并找到最佳的n_neighbors值以获得最高得分。
  14. 使用决策树回归模型进行训练和预测,并计算模型的得分。
  15. 使用随机森林回归模型进行训练和预测,并计算模型的得分。

以上就是这段代码的主要流程。它包括了数据加载、数据预处理、特征工程、模型训练和评估等步骤,用于分析太阳能发电数据并建立回归模型进行预测。

特征变量之间相关性绘图

四种方法分别为线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型

 选择SOURCE_KEY列的1BY6WEcLGh8j5v7 的光伏板进行AC POWER预测。

真实值与预测值展示

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

深度学习的奋斗者

你的鼓励是我努力的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值