1.对数据进行分组,groupby()
(1)指定分组列
(2)size(),count(),count获取更详细
(3)对数据进行迭代输出
for….in循环输出分组后的结果
(4)将groupby分类结果转化成字典
(5)按照列的数据类型进行分组df.groupby(df.dtypes,axis=1),默认(axis=0)是按行
(6)选择分类数据中的一个或一组
2.分组计算
(1)通过字典或者Series进行分组
(2)sum(),count()
(3)常用的分组计算max(),min()。查看属性describe()
3.函数agg(func),进行聚合操作
(1)定义函数,获取DataFrame中某一列数据的最大值和最小值之差
(2)调用多个聚合函数
peak_range是求最大值和最小值之差的函数
(3)对函数加元组,提供新的列名
(4)使用字典实现数据集的每列作用不同的聚合函数
(5)as_index。 传入as_index是否将行索引作为索引