在进行统计描述时,pandas对三个数据对象的轴参数规定如下:
Series: 没有轴参数
DataFrame: “index” (axis=0, default), “columns” (axis=1)
Panel: “items” (axis=0), “major” (axis=1, default), “minor” (axis=2)
统计描述参数如下:
Function | Description | 描述 |
---|---|---|
count | Number of non-null observations | 观测值的个数 |
sum | Sum of values | 求和 |
mean | Mean of values | 求平均值 |
mad | Mean absolute deviation | 平均绝对方差 |
median | Arithmetic median of values | 中位数 |
min | Minimum | 最小值 |
max | Maximum | 最大值 |
mode | Mode | 众数 |
abs | Absolute Value | 绝对值 |
prod | Product of values | 乘积 |
std | Bessel-corrected sample standard deviation | 标准差 |
var | Unbiased variance | 方差 |
sem | Standard error of the mean | 标准误 |
skew | Sample skewness (3rd moment) | 偏度系数 |
kurt | Sample kurtosis (4th moment) | 峰度 |
quantile | Sample quantile (value at %) | 分位数 |
cumsum | Cumulative sum | 累加 |
cumprod | Cumulative product | 累乘 |
cummax | Cumulative maximum | 累最大值 |
cummin | Cumulative minimum | 累最小值 |
cov() | covariance | 协方差 |
corr() | correlation | 相关系数 |
rank() | rank by values | 排名 |
pct_change() | time change | 时间序列变化 |