笔记来源:利用python进行数据分析【Wes Mckinnney著,唐学韬等译】
一、汇总和计算描述统计
pandas对象拥有一组常用的数学和统计方法,大部分属于约简和汇总统计,用于从Series中提取单个值(如sum、mean)或从DataFrame的行或列中提取一个Series.
1、相关示例
(1) 常用约简方法(sum()、mean()等)
约简方法的常见选项:
选项 | 说明 |
axis | 约简的轴 |
skipna | 默认为True.即默认排除缺失值 |
level | 若轴是层次化索引(即MultiIndex),则根据level分组约简 |
间接统计(idxmax())
(2) 累计型【如cumsum()】
(3) 汇总统计【如describe()】
(4)常见的汇总描述统计
方法 | 说明 |
count | 计算样本值中非NA值的数量 |
describe | 针对Series或各DataFrame列计算汇总统计 |
min、max | 计算样本值的最小值、最大值 |
argmin、argmax | 计算能够获取到最小值、最大值的索引位置(整数) |
idxmin、idxmax | 计算能够获取到最小值、最大值的索引值 |
quantile | 计算样本值的分位数(0到1) |
sum | 计算样本值的总和 |
mean | 计算样本值的平均数 |