import pandas as pd
import numpy as np
df={'A': ['bob','millor','bob','bob'],
'B': [12,15,34,98],
'C' : [45,23,88,23]}
# df=pd.DataFrame(df).astype(int)
df=pd.DataFrame(df)
print( df)
print('_'*60)
# (1)获取按A分组后B列的最大值
print( df.groupby(by='A').agg({'B':'max'}))
print('_'*60)
# (2)获取按A分组后B列的最大值和最小值
print( df.groupby(by='A').agg({'B':['max','min']}))
print('_'*60)
# (3)获取按A分组后B列的最大值和最小值以及C列的最大值
print( df.groupby(by='A').agg({'B':['max','min'], 'C':'min'}))
print('_'*60)
# (4)默认是以函数名称命名的,可以修改
print( df.groupby(by='A').agg(
b_min=pd.NamedAgg(column='B', aggfunc='min'),
b_max=pd.NamedAgg(column='B', aggfunc='max')))
python agg
最新推荐文章于 2024-01-22 20:00:00 发布