pandas统计计算和描述
常用统计计算:
-
sum, mean, max, min
-
axis=0表示按列统计,axis=1按行统计
-
skipna 排除缺失值,默认为True
-
idmax, idmin, cumsum
import numpy as np import pandas as pd df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd']) print(df_obj) print('------------') print('求和') print(df_obj.sum()) print('------------') print('求最大值') print(df_obj.max()) print('------------') print('按行求最小值') print(df_obj.min(axis=1))
运行结果:
统计描述:
-
describe 产生多个统计数据
df_obj.describe()
运行结果:
函数 | 描述 |
---|---|
count | 非NA值的数量 |
describe | 针对series或各dataframe列计算汇总统计 |
min,max | 最大、最小值 |
argmin,argmax | 计算最小值、最大值的索引位置 |
idmin,idmax | 计算最小值、最大值的索引值 |
quantile | 计算样本的分位数(0到1) |
sum | 求和 |
mean | 平均数 |
median | 算术中位数 |
mad | 根据平均值计算平均绝对离差 |
var | 方差 |
std | 标准差 |
skew | 样本值的偏度(三阶距) |
kurt | 样本值的峰度(四阶距) |
cumsum | 样本值累计和 |
cummin,cummax | 样本值的累计最大值和累计最小值 |
cumprod | 样本值的累计积 |
diff | 计算一阶差分 |
pct_change | 计算百分数变化 |