数据集:不同地区居民消费数据
包含内容
:均值、方差、标准差、变异系数、偏度、峰度、中位数、上、下四分位数、四分位极差、三均值、直方图、茎叶图、箱线图、相关性分析、正态性分析与检验。
数据集
年份 | 全国居民 | 农村居民 | 城镇居民 |
---|---|---|---|
1978 | 184 | 138 | 405 |
1979 | 207 | 158 | 434 |
1980 | 236 | 178 | 496 |
1981 | 262 | 199 | 562 |
1982 | 284 | 221 | 576 |
1983 | 311 | 246 | 603 |
1984 | 354 | 283 | 662 |
1985 | 437 | 347 | 802 |
1986 | 485 | 376 | 920 |
1987 | 550 | 417 | 1089 |
1988 | 693 | 508 | 1431 |
1989 | 762 | 553 | 1568 |
1990 | 803 | 571 | 1686 |
1991 | 896 | 621 | 1925 |
1992 | 1070 | 718 | 2356 |
1993 | 1331 | 855 | 3027 |
1994 | 1746 | 1118 | 3891 |
1995 | 2336 | 1434 | 4874 |
1996 | 2641 | 1768 | 5430 |
1997 | 2834 | 1876 | 5796 |
1998 | 2972 | 1895 | 6217 |
1999 | 3180 | 1973 | 6651 |
导包
import numpy as np
import pandas as pd
import scipy.stats as st
import matplotlib.pyplot as plt
from itertools import groupby
导入数据
costData = pd.read_excel('1.3.xlsx') #读入Excel文件
预处理数据
cost = np.array(costData.iloc[:,1:4].astype('float')) # 除去年份数据
计算均值、方差、标准差、变异系数、偏度、峰度
print('均值',np.mean(cost,axis=0))
print('方差',np.var(cost,axis=0))
print('标准差',np.std(cost,axis=0))
print('变异系数',np.std(cost,axis=0)*100 / np.mean(cost,axis=