pandas分组分析
- 根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间差异性的分析方法;
- 分组分析常用的统计指标是计数、求和、平均值等。
groupby(by=[分组列1,分组列2,…])
[统计列1,统计列2,…]
.agg({
统计列别名1:统计函数1,统计列别名2:统计函数2,…})
pandas交叉分析
- 通常用于分析两个或两个以上分组变量之间的关系,以交叉表形式进行变量间关系的对比分析;
- 从数据的不同维度,综合进行分组细分,进一步了解数据的构成、分布特征;
- 交叉分析有数据透视表和交叉表两种。