取根据时间最小值的行
# 这样得到的不是按照ts最小排序的第一行数据
# grouped=data.groupby(['t1.date','t1.imei','address']).head(1) #43626行
grouped=data.groupby(['t1.date','t1.imei']).apply(lambda t: t[t.ts==t.ts.min()])
grouped.head()
取出现频次最多的行
# 计算address出现的频次
data['counts'] = 0
data = data.groupby(['t1.date','t1.imei','address'], as_index=False)['counts'].count()
# 取出现频次最多的行
grouped=data.groupby(['t1.date','t1.imei']).apply(lambda t: t[t.counts==t.counts.max()])
只取出现最早的数据
Python
grouped = data['time'].groupby(data['imei'])
mindf = grouped.min().to_frame() ## 重要~~删除线格式~~
mindf = mindf.reset_index()
mindf.head()
SQL - row_number()
-- 活跃
select date