1)。我有以下示例数据集:>>> df
ID Region count
0 100 Asia 2
1 101 Europe 3
2 102 US 1
3 103 Africa 5
4 100 Russia 5
5 101 Australia 7
6 102 US 8
7 104 Asia 10
8 105 Europe 11
9 110 Africa 23
我想将这个数据集的观察结果按ID区域进行分组,并将每组的计数相加。所以我用了这样的东西:>>> print(df.groupby(['ID','Region'],as_index=False).count().sum())
ID Region count
0 100 Asia 2
1 100 Russia 5
2 101 Australia 7
3 101 Europe 3
4 102 US 9
5 103 Africa 5
6 104 Asia 10
7 105 Europe 11
8 110 Africa 23
在使用as_index=False时,我能够获得“类似SQL”的输出。我的问题是我无法在这里重命名聚合变量计数。所以在SQL中,如果想做上面的事情,我会这样做:select ID, Region, sum(count) as Total_Numbers
from df
group by ID, Region
order by ID, Region
如我们所见,在S