数据集:不同地区居民消费数据

该博客通过对不同地区居民消费数据的分析,涵盖了数据预处理、统计指标计算(如均值、方差、标准差等)以及直方图、茎叶图和箱线图的绘制。同时,进行了相关性分析和正态性检验,结果显示数据可能遵循正态分布。
摘要由CSDN通过智能技术生成

数据集:不同地区居民消费数据

包含内容:均值、方差、标准差、变异系数、偏度、峰度、中位数、上、下四分位数、四分位极差、三均值、直方图、茎叶图、箱线图、相关性分析、正态性分析与检验。

数据集

年份 全国居民 农村居民 城镇居民
1978 184 138 405
1979 207 158 434
1980 236 178 496
1981 262 199 562
1982 284 221 576
1983 311 246 603
1984 354 283 662
1985 437 347 802
1986 485 376 920
1987 550 417 1089
1988 693 508 1431
1989 762 553 1568
1990 803 571 1686
1991 896 621 1925
1992 1070 718 2356
1993 1331 855 3027
1994 1746 1118 3891
1995 2336 1434 4874
1996 2641 1768 5430
1997 2834 1876 5796
1998 2972 1895 6217
1999 3180 1973 6651

导包

import numpy as np
import pandas as pd
import scipy.stats as st
import matplotlib.pyplot as plt
from itertools import groupby

导入数据

costData = pd.read_excel('1.3.xlsx')  #读入Excel文件

预处理数据

cost = np.array(costData.iloc[:,1:4].astype('float')) # 除去年份数据

计算均值、方差、标准差、变异系数、偏度、峰度

print('均值',np.mean(cost,axis=0))
print('方差',np.var(cost,axis=0))
print('标准差',np.std(cost,axis=0))
print('变异系数',np.std(cost,axis=0)*100 / np.mean(cost,axis=
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DeeGLMath

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值