电力需求预测挑战赛
【训练时序预测模型助力电力需求预测】
给定多个房屋对应电力消耗历史N天的相关序列数据等信息,预测房屋对应电力的消耗。
赛题数据简介
每日日期用1-N进行标识。即1为数据集最近一天,其中1-10为测试集数据。
数据集由字段id(房屋id)、 dt(日标识)、type(房屋类型)、target(实际电力消耗)组成。
baseline关键算法:
target_mean = train[train[‘dt’]<=20].groupby([‘id’])[‘target’].mean().reset_index()
想要计算C中每一个类别里面 A 列的平均值。
df.groupby('C')['A'].mean()
首先使用了pandas里面的groupby函数,按照id将前11~20天之间的数据进行聚合,计算id中每一个房屋target的均值
[‘target’].mean()这个地方表示按照竖轴进行平均,如果是按照横轴则是mean(1)
接着再使用merge进行一个交集,得到结果。