电力需求预测挑战赛算法挑战大赛

一、赛题背景

随着全球经济的快速发展和城市化进程的加速,电力系统面临着越来越大的挑战。电力需求的准确预测对于电网的稳定运行、能源的有效管理以及可再生能源的整合至关重要。

为提高电力需求预测的准确性和可靠性,推动智能电网和可持续能源系统的发展,本场以“电力需求预测”为赛题的数据算法挑战赛。选手需要根据历史数据构建有效的模型,能够准确的预测未来电力需求。

那么我们的赛题数据由训练集和测试集组成,为了保证比赛的公平性,将每日日期进行脱敏,用1-N进行标识,即1为数据集最近一天,其中1-10为测试集数据。数据集由字段id(房屋id)、 dt(日标识)、type(房屋类型)、target(实际电力消耗)组成。

特征字段字段描述
id房屋id
dt日标识
type房屋类型
target实际电力消耗,预测目标

 二、数据理解

  1. 登录百度账号

  2. 2.运行项目

3.启动飞桨 AI studio

 

进入后运行如下

 然后下载submit.csv,提交到官方结果,以下为小白踩的坑啊。

  1. 数据可以下载在本地吗   数据是电力需求预测挑战赛数据集.zip,里边test.csv、train.csv,但是有个我从官方下载显示“已停止访问该网页”。 我是在baseline1运行时候test..to_csv('train.csv', index=None),发现在首页后下载到本地。

  2. 工具必须是飞桨运行吗   可以在pycharm、vscode,jupyter,工具是运行的手段,选择喜欢的为好。

    3.代码看不懂怎么办  datawhale给的代码其实少,我是一行行print,看的,然后问大模型,比如chatgpt。其中,target_mean = train[train['dt']<=20].groupby(['id'])['target'].mean().reset_index(),这个真没看懂,然后问train[train['dt']<=20]是什么意思,知道是筛选列小于等于20的数据。groupby(['id'])['target'].mean()是分组操作,意思是不同ID的target取平均值,类似于Excel常见meanif用法,这行意思是分组操作重新分布,其中包含每个 id 的 target 列的平均值。简单说就是找ID下target平均值为target。                              test = test.merge(target_mean, on=['id'], how='left')意思是个test与target_mean根据id进行左合并。

    总结,对于小白上手方法是多问大模型、多print,多运行。

    最后,感谢datawhale提供的开源学习。

    已停止访问该网页

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值