Pandas-Task03-分组
一、SAC
SAC指的是分组操作中的split-apply-combine过程;
其中split指基于某一些规则,将数据拆分成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构。
在改过程中,往往会遇到四类问题:
整合(Aggregation) —— 即分组计算统计量(如求均值、求每组元素个数)
变换(Transformation) —— 即分组对每个单元的数据进行操作(如元素标准化)
过滤(Filtration) —— 即按照某些规则筛选出一些组(如选出组内某一指标小于50的组)
综合问题 —— 即上面三种问题的混合。
二、group by函数
三、聚合、过滤和变换
四、apply函数