电力需求预测挑战赛算法挑战大赛

最新推荐文章于 2024-07-19 22:46:50 发布

qq_38138014

最新推荐文章于 2024-07-19 22:46:50 发布

阅读量387

点赞数 5

分类专栏： #datawhale夏令营 #飞桨 #电力需求预测挑战赛文章标签：人工智能大数据

本文链接：https://blog.csdn.net/qq_38138014/article/details/140424393

版权

1 篇文章 0 订阅

订阅专栏

一、赛题背景

随着全球经济的快速发展和城市化进程的加速，电力系统面临着越来越大的挑战。电力需求的准确预测对于电网的稳定运行、能源的有效管理以及可再生能源的整合至关重要。

为提高电力需求预测的准确性和可靠性，推动智能电网和可持续能源系统的发展，本场以“电力需求预测”为赛题的数据算法挑战赛。选手需要根据历史数据构建有效的模型，能够准确的预测未来电力需求。

那么我们的赛题数据由训练集和测试集组成，为了保证比赛的公平性，将每日日期进行脱敏，用1-N进行标识，即1为数据集最近一天，其中1-10为测试集数据。数据集由字段id（房屋id）、 dt（日标识）、type（房屋类型）、target（实际电力消耗）组成。

二、数据理解

3.启动飞桨 AI studio

进入后运行如下

然后下载submit.csv,提交到官方结果，以下为小白踩的坑啊。

数据可以下载在本地吗数据是电力需求预测挑战赛数据集.zip，里边test.csv、train.csv,但是有个我从官方下载显示“已停止访问该网页”。我是在baseline1运行时候test..to_csv('train.csv', index=None),发现在首页后下载到本地。
工具必须是飞桨运行吗可以在pycharm、vscode，jupyter，工具是运行的手段，选择喜欢的为好。

3.代码看不懂怎么办 datawhale给的代码其实少，我是一行行print，看的，然后问大模型，比如chatgpt。其中，target_mean = train[train['dt']<=20].groupby(['id'])['target'].mean().reset_index()，这个真没看懂，然后问train[train['dt']<=20]是什么意思，知道是筛选列小于等于20的数据。groupby(['id'])['target'].mean()是分组操作，意思是不同ID的target取平均值，类似于Excel常见meanif用法，这行意思是分组操作重新分布，其中包含每个 id 的 target 列的平均值。简单说就是找ID下target平均值为target。 test = test.merge(target_mean, on=['id'], how='left')意思是个test与target_mean根据id进行左合并。

总结，对于小白上手方法是多问大模型、多print，多运行。

最后，感谢datawhale提供的开源学习。

已停止访问该网页