形如
id
0 1
1 1
2 3
3 5
4 5
5 1
类型的DataFrame,现在要统计每个id出现的次数并制成一个新的DataFrame。
看了很多教程都没有实现,自己琢磨出了一个方法。
df.groupby(['id'],as_index=False)['id'].agg({'cnt':'count'})
其中agg中字典的第一个参数是列名,第二个是函数名。
输出结果如下
id cnt
0 1 3
1 3 1
2 5 2
实现了统计每个id个数。以上。
由 @Castlehe 提出的一种简便方法
df['id'].value_counts()
输入参数为需要统计列的Series,输出以value为index的Series。
结果如下
1 3
5 2
3 1
Name: id, dtype: int64
可以通过reset_index()函数得到与上面相同的输出。