1. 问题
在做数据挖掘过程中,有时需要做一些数据聚合后的统计特征,如求最大值,均值,中位数等等,这些都可以通过将主键进行groupby,然后直接使用max(),mean(),median()等方法。但是当想要求聚合后的众数(mode),却发现出现错误,通过dir(df.groupby('a'))指令查看并没有该方法。故不能直接使用df.groupby('a').mode().reset_index()
In [1]: import pandas as pd
In [2]: df = pd.DataFrame({
'a':['A','A','A','A','B','B','B','B
...: ','B'],'b':[1,1,2,3,1,2,2,3,3]})
In [3]: df
Out[3]:
a b
0 A 1
1 A 1
2 A 2
3 A 3
4 B 1
5 B 2
6 B 2
7 B 3
8 B 3
In [4]: df.groupby('a').max().reset_index()
Out[4]:
a b
0 A 3
1 B 3
In [5]: df.groupby(&#