1.数据分组
源数据表如下所示:
1.1 分组键是列名
分组键是列名时直接将某一列或多列的列名传给groupby()方法,groupby()方法就会按照这一列或多列进行分组。按照一列进行分组
import pandas as pd
df = pd.DataFrame(pd.read_excel("Client_Data.xlsx"))
print(df)
#按照客户分类对数据进行分组
print (df.groupby("客户分类").count())
根据客户分类对所有数据进行分组,然后对分组以后的数据分别进行计数运算,最后进行合并,如下:
源数据展示及按客户分类的结果按照多列进行分组
import pandas as pd
df = pd.DataFrame(pd.read_excel("Client_Data.xlsx"))
print(df)
#按照多列对数据进行分组
print (df.groupby(["客户分类","区域"]).count())
执行结果如图:
按照多列对数据进行分组
1.2 分组键是Series
把DataFrame的其中一列取出来就是一个Series,比如df["客户分类"]就是一个Series。
分组键是列名与分组键是Series的唯一区别就是,给groupby()方法传入了什么,其他都一样。可以按照一个或多个Series进行分组,分组以后的汇总计算也是完全一样的,也支持对分组以后的某些列进行汇总计算。