Pandas 数据筛选,去重结合group by
需求
今小伙伴有一个Excel表, 是部门里的小伙9月份打卡记录, 关键字段如下:
姓名, 工号, 日期, 打卡方式, 时间, 详细位置, IP地址....
脱敏数据:
姓名
工号
日期
方式
时间
...
小赵
123
2019-09-01
GPS
08:37:50
....
小赵
123
2019-09-01
GPS
18:10:50
...
小陈
124
2019-09-01
GPS
08:47:30
...
小陈
124
2019-09-01
GPS
15:07:50
...
小陈
124
2019-09-01
GPS
18:07:5
...
小赵
123
2019-09-02
GPS
08:55:50
...
小李
125
2019-09-02
PC
13:10:24
即每个小伙伴, 一个月(30天), 正常打卡是60次, 上午,下午各一次/每天. 但真实情况是: 可能忘记打卡,或者一天打了n次, 现要求是 筛选出上班迟到(9:00) 的所有人员信息.
一看, 这用Excel, 透视一下姓名, 然后筛选