今天做了一个分类统计,感叹下pandas的强大,也记录下。
统计抽象下类似是这样的,第一列和第二列是事物,第三列表示时间段,第四列表示被访问的值,总计100多万行数据,需要统计aaa、bbb在各时段被访问的次数,a/b/c在各时段被访问的次数:
key1 | key2 | time_h | value |
aaa | a | 1 | 13 |
aaa | b | 3 | 14 |
aaa | c | 2 | 15 |
bbb | a | 2 | 16 |
今天做了一个分类统计,感叹下pandas的强大,也记录下。
统计抽象下类似是这样的,第一列和第二列是事物,第三列表示时间段,第四列表示被访问的值,总计100多万行数据,需要统计aaa、bbb在各时段被访问的次数,a/b/c在各时段被访问的次数:
key1 | key2 | time_h | value |
aaa | a | 1 | 13 |
aaa | b | 3 | 14 |
aaa | c | 2 | 15 |
bbb | a | 2 | 16 |