城市需水预测-数据探索
1. 赛题任务:
本赛题要求参赛者利用2018年1月1日-2020年10月31日两大供水厂日供水量明细数据,预测2020年11月1日-2021年3月31日两厂每日供水量。
2. 读取数据
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
submit = pd.read_csv('submit.csv')
3. 处理时间
def DateSplit(df,col):
temp_df = df[col].str.split('/',expand=True)
temp_df.columns = ["year","month","day"]
df = pd.concat([df,temp_df],axis=1)
#df = df.drop("日期",axis=1)
return df
train = DateSplit(train,'日期')
columns = ['日期','year','month','day','A厂','B厂']
train = train[columns]
train
4. groupby
aa = train1.groupby(['year','month']).mean()
aa
fig = plt.figure(figsize=(24,10))
aa['A厂'].plot()
aa['B厂'].plot()
plt.legend(['A', 'B'], loc='up right')
plt.show()
gp1 = train1.groupby('month').mean()
gp1
fig = plt.figure(figsize=(10,5))
gp1['A厂'].plot()
gp1['B厂'].plot()
plt.legend(['A', 'B'], loc='up right')
plt.show()