问题:
怎么根据消费记录,按照日期和某个类别进行人数的统计?
数据:
现在以食堂的刷卡记录为例,统计每天每餐的就餐人数,数据大概如下:
方案:
为了统计每天每餐的就餐人数,至少要进行一下3点:
1.把【消费时间】列进行处理,得到【日期】列,因为我们以天为单位统计;
2.去除重复的消费记录:所谓重复,即当天当餐某个人有多条消费记录,这里只保留一条。
由于【人员姓名】列可能有重复值,因为不排除重名情况,所以以【人员编号】为依据,进行去重。
3.查看【餐别】的所有类别,然后按照餐别的具体类别进行统计。
代码:
import pandas as pd
def NumCal(data):
df=pd.read_excel(data,encoding='gb18030',converters={'人员编号':lambda x: str(x)})
df['日期']=df['消费时间'].app