0.
对所有数据进行分组
然后对每一个组应用一个函数
之后进行分组统计或者生成透视
以上
pd有一个groupby功能 这是上述内容的核心 可以切片、切块、摘要
pd可以进行:
计算分组摘要统计 如计数、平均值、标准差、自定义函数
计算分组概述统计 如数量、平均值、标准差、自定义函数(这俩有啥区别。。)
应用组内转换或其它运算 如规格化、线性回归、排名、选取子集
计算透视表或交叉表
执行分位数分析以及其他统计分组分析
对事件序列数据的聚合 叫做重采样 (chong)
1.
groupby机制
在一个指定的轴上进行三步:拆分、应用、合并
特别的,拆分 是沿着一个轴把同样的放在一起 这就进行了分组
分组除了根据上边这个名字,还可以根据长度
如果是字典或是Series 可以按照待分组轴上的值 和分组名的对应关系
也可以用函数处理轴索引或索引中的各个标签
第一个是关键 后三个是快捷方式
1.5
按照key1进行分组 计算data1的平均值
这ged就是个groupby类型的对象
这是个Series 他根据data1的分组键a,b进行了聚合产生了新的Series
默认转的是最靠里的那行