首先把你的数据放到panda数据框中——我自己编了一个虚拟数据——你需要弄清楚如何加载你的数据源。(来自csv或excel)。
启动框架
import pandas as pd
import datetime
df1 = pd.DataFrame({'Start_date' : ['2018-01-01','2018-01-02','2018-01-03','2018-02-
01','2018-03-10','2018-02-05'],'food' : [2, 2.5, 3, 2.4, 5, 4],'drinks' :
[1,2,3,4,5,6], 'wastage':[6,5,4,3,2,1]})
确保您的日期列上有日期格式-在这里我的输入是字符串,所以我需要转换它(您需要在这里使用不同的格式)参见(文档底部的日期格式:
https://docs.python.org/2/library/datetime.html
df1.Start_date = pd.to_datetime(df1.Start_date, format ='%Y-%m-%d')
我将添加一个月列:
编辑年份:
df1["period"] = df1.Start_date.apply(lambda x: datetime.datetime.strftime(x, '%b-%y'))
df1['month'] = pd.DatetimeIndex(df1.Start_date).month
按平均值分组
df1.groupby(['month']).mean() # for only month groupings
df1.groupby(['period']).mean() # for output listed above