前言
对数据进行统计,特别是多次统计可能要写多行,想偷懒,于是发现了这个方法。
解决方法
# 下面通过 agg 来对status的两个变量分别统计,其实进站出站度可以count
# 1、sum 这个变量的总值 ,赋值给sum这一列
# 2、count 这个变量group之后的记录的数量,赋值给count
data1= data.groupby(['time_hour','time_minute', 'stationID'])['status'].agg({'sum':'sum','count':'count'}).reset_index()
这个就类似于sql语句那么简单,并且多次统计。