Python常用的分组方式,一种pivot_table,一种groupby
自定义函数,df_series(x)用来对某一列去重拼接,df_len(x)用来对某一列去重计数,前提目标列必须是字符串。
def df_series(x):
return ','.join(set(x))
def df_len(x):
return len(set(x))
pivot_table 方法
pd.pivot_table(data,index='商户名',values=['交易金额','付款方'],aggfunc=[{'商户名':np.sum,'付款方':[df_series,df_len]}])
groupby() 方法
data.groupby(["商户名"])['交易金额','付款方'].agg({'交易金额':np.sum,'付款方':[df_series,df_len]})