数学建模入门-python计算常用统计量

常用统计量概念

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

演示

演示数据如下,保存到磁盘上

身高,体重
172,75
171,62
166,62
160,55
155,57
173,58
166,55
170,63
167,53
173,60
178,60
173,73
163,47
165,66
170,60
163,50
172,57
182,63
171,59
177,64

这里只求了身高的统计量

import pandas as pd
df = pd.read_csv('datas/data1.csv')
print(df['身高'])
print('均值',df['身高'].mean())
print('中位数', df['身高'].median())

print('方差', df['身高'].var())
print('标准差', df['身高'].std())
print('极差', df['身高'].max()-df['身高'].min())

print('偏度', df['身高'].skew())
print('峰度', df['身高'].kurt())

在这里插入图片描述

封装

可以把之前的代码简单封装一下,便于以后使用

def cal_sta(dataFrameColumn):
    print('均值', dataFrameColumn.mean())
    print('中位数', dataFrameColumn.median())

    print('方差', dataFrameColumn.var())
    print('标准差', dataFrameColumn.std())
    print('极差', dataFrameColumn.max() - dataFrameColumn.min())

    print('偏度', dataFrameColumn.skew())
    print('峰度', dataFrameColumn.kurt())

这样当自己需要多个统计量时,就不用一行行写,直接将要计算的列给这个工具方法即可

最后附上其他常用统计量的调用方法

count 	非 NA 值的数量
describe 	针对 Series 或 DF 的列计算汇总统计
min , max 	最小值和最大值
argmin , argmax 	最小值和最大值的索引位置(整数)
idxmin , idxmax 	最小值和最大值的索引值
quantile 	样本分位数(0 到 1)
sum 	求和
mean 	均值
median 	中位数
mad 	根据均值计算平均绝对离差
var 	方差
std 	标准差
skew 	样本值的偏度(三阶矩)
kurt 	样本值的峰度(四阶矩)
cumsum 	样本值的累计和
cummin , cummax 	样本值的累计最大值和累计最小值
cumprod 	样本值的累计积
diff 	计算一阶差分(对时间序列很有用)
pct_change 	计算百分数变化
发布了122 篇原创文章 · 获赞 38 · 访问量 4万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览