四种不同机器学习方法(线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型)对光伏发电预测

1.数据集介绍(可以看短期光伏发电量短期预测(Python代码,基于LSTM模型)_深度学习的奋斗者的博客-CSDN博客

两篇文章用的是同一个数据集,不同的的是本篇多了温度特征。

只对数据集感兴趣的可以关注:https://blog.csdn.net/qq_40840797/article/details/131842873

这些是温度数据集中的列名:

  • DATE_TIME: 日期和时间
  • PLANT_ID: 电厂ID
  • SOURCE_KEY: 数据源的关键字
  • AMBIENT_TEMPERATURE: 环境温度
  • MODULE_TEMPERATURE: 模块温度
  • IRRADIATION: 辐照度

这些列包含了太阳能发电数据和气象传感器数据的各个指标和变量。

2020/5/15 0:004135001HmiyD2TTLFNqkNe25.1843161322.85750740
2020/5/15 0:154135001HmiyD2TTLFNqkNe25.0845886722.761667870
2020/5/15 0:304135001HmiyD2TTLFNqkNe24.935752622.592305530
2020/5/15 0:454135001HmiyD2TTLFNqkNe24.846130422.360852130
2020/5/15 1:004135001HmiyD2TTLFNqkNe24.6215253622.165422640
2020/5/15 1:154135001HmiyD2TTLFNqkNe24.536092221.968570870
2020/5/15 1:304135001HmiyD2TTLFNqkNe24.6386738722.352925670
2020/5/15 1:454135001HmiyD2TTLFNqkNe24.8730223323.16091920
2020/5/15 2:004135001HmiyD2TTLFNqkNe24.9369304723.0261130
2020/5/15 2:154135001HmiyD2TTLFNqkNe25.012247623.343229270
2020/5/15 2:304135001HmiyD2TTLFNqkNe25.0051493323.639459270
2020/5/15 2:454135001HmiyD2TTLFNqkNe24.9930195324.03948580
2020/5/15 3:004135001HmiyD2TTLFNqkNe25.0163094324.384135570
2020/5/15 3:154135001HmiyD2TTLFNqkNe24.9852152724.351507730
2020/5/15 3:304135001HmiyD2TTLFNqkNe24.9377319324.060296530
2020/5/15 3:454135001HmiyD2TTLFNqkNe24.8790995323.709794130
2020/5/15 4:004135001HmiyD2TTLFNqkNe24.678902222.589941530
2020/5/15 4:154135001HmiyD2TTLFNqkNe24.351930821.783642530
2020/5/15 4:304135001HmiyD2TTLFNqkNe24.062622221.852524930
2020/5/15 4:454135001HmiyD2TTLFNqkNe24.013224222.3063150
2020/5/15 5:004135001HmiyD2TTLFNqkNe24.177105822.551908470
2020/5/15 5:154135001HmiyD2TTLFNqkNe24.30488822.979492070
2020/5/15 5:304135001HmiyD2TTLFNqkNe24.3287272723.452380470
2020/5/15 5:454135001HmiyD2TTLFNqkNe24.2892111323.096691930.000862721
2020/5/15 6:004135001HmiyD2TTLFNqkNe24.0884460722.20675660.005886957

2.代码流程

  1. 导入所需的库,包括numpy、pandas、seaborn和matplotlib.pyplot。
  2. 读取两个CSV文件的数据,分别是'Plant_1_Generation_Data.csv'(发电相关信息)和'Plant_1_Weather_Sensor_Data.csv'(温度相关信息),存储到两个DataFrame变量中。
  3. 打印一些数据统计信息,如唯一值的数量和数据的概要。
  4. 将日期时间列转换为datetime类型。
  5. 使用pd.merge函数将两个数据集按照日期时间进行合并,生成一个新的DataFrame df。
  6. 检查并打印df中的缺失值情况。
  7. 绘制df中各个变量之间的散点图矩阵。
  8. 使用LabelEncoder对SOURCE_KEY列进行编码。
  9. 创建一个新的DataFrame df_ml作为机器学习模型的输入数据,并选择特征变量X和目标变量y。
  10. 计算特征变量X之间的相关性,并使用相关性矩阵进行可视化。
  11. 将数据集拆分为训练集和测试集。
  12. 使用线性回归模型进行训练和预测,并计算模型的得分。
  13. 使用K近邻回归模型进行训练和预测,并找到最佳的n_neighbors值以获得最高得分。
  14. 使用决策树回归模型进行训练和预测,并计算模型的得分。
  15. 使用随机森林回归模型进行训练和预测,并计算模型的得分。

以上就是这段代码的主要流程。它包括了数据加载、数据预处理、特征工程、模型训练和评估等步骤,用于分析太阳能发电数据并建立回归模型进行预测。

特征变量之间相关性绘图

四种方法分别为线性回归模型,K近邻回归模型,决策树回归模型,随机森林回归模型

 选择SOURCE_KEY列的1BY6WEcLGh8j5v7 的光伏板进行AC POWER预测。

真实值与预测值展示

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
股价数据预测是金融领域的一个重要应用。下面是对你提到的几种机器学习算法在股价数据预测中的应用: 1. 线性回归:线性回归是一种基本的统计学习方法,它可以用来建立股价与其他变量之间的线性关系模型。通过收集多个因素对股价的影响,例如市场指数、财务指标等,利用线性回归可以建立一个预测模型,从而预测股价的变化趋势。 2. k-近邻:k-近邻是一种基于样本距离的分类与回归方法,它可以通过寻找与目标样本最近的k个邻居,来预测目标样本的值。在股价预测中,可以利用历史股价数据作为训练样本,通过寻找与目标日期最近的历史数据,来预测未来的股价变化。 3. 决策树决策树是一种基于树形结构的分类与回归方法,它通过将样本分割成不同的子集,从而建立一个分类或回归模型。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立决策树模型预测未来的股价变化。 4. 随机森林:随机森林是一种基于多个决策树的集成学习方法,它通过随机选择特征和样本来建立多个决策树,从而提高模型的泛化性能。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立随机森林模型预测未来的股价变化。 5. 支持向量机:支持向量机是一种基于最大间隔分类的分类与回归方法,它通过寻找一个最优的超平面来将样本分割成不同的类别。在股价预测中,可以利用历史股价数据和其他因素作为训练样本,通过建立支持向量机模型预测未来的股价变化。 6. LSTM:LSTM是一种特殊的循环神经网络,它通过引入门控机制来解决长期依赖问题,从而适用于序列数据的建模。在股价预测中,可以利用历史股价数据作为训练样本,通过建立LSTM模型预测未来的股价变化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

深度学习的奋斗者

你的鼓励是我努力的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值