快学数据挖掘—数据探索—分布分析和统计量分析

分布分析


揭示数据的分布特征和分布类型

  • 定量数据:频率分析、频率分布表、直方图、茎叶图
  • 定性数据:饼图、条形图

统计量分析


用统计学指标对定量数据进行描述性分析,例如均值,中位数,众数;极差,标准差,四分位数间距等。

定量数据的分布分析


下面使用SPSS进行频率分析,分析菜品捞起生鱼片在2014年第二个季度的销售数据,绘制销售量的频率分布图,对销售量进行分布分析。

数据集

catering_fish_congee.xls

数据集下载地址

img

参数设置

img

img

img

img

分析结果

img

img

分箱区间宽度设置为400,如下

img

Python程序

#coding: utf-8

import matplotlib.pyplot as plt
from numpy import nan as NA
import pandas as pd

# 读取数据源
xlsFilename = "catering_fish_congee.xls"
df = pd.read_excel(xlsFilename)

# 获得销售额列
dfSalesAmount = df.iloc[:,1]


########################################################
# 统计量分析
# 均值
mean_ = dfSalesAmount.mean()

# 中位数
median_ = dfSalesAmount.median()

# 众数
mode_ = dfSalesAmount.mode()

# 极差
range_ = dfSalesAmount.max() - dfSalesAmount.min()

# 标准差
std_ = dfSalesAmount.std()

# 四分位数区间
distance_ = dfSalesAmount.quantile(0.75) - dfSalesAmount.quantile(0.25)

print ("销售量均值: {0:.2f}".format(mean_))
print ("销售量中位数: {0:.2f}".format(median_))
print ("销售量众数: {}".format(mode_))
print ("销售量极差: {}".format(range_))
print ("销售量标准差: {0:.2f}".format(std_))
print ("销售量四分位数区间: {0:.2f}".format(distance_))

print (df.describe())
结果
销售量均值: 1241.33
销售量中位数: 900.00
销售量众数: 0    420
dtype: int64
销售量极差: 3915
销售量标准差: 941.32
销售量四分位数区间: 1372.50
               420
count    90.000000
mean   1241.333333
std     941.317843
min      45.000000
25%     420.000000
50%     900.000000
75%    1792.500000
max    3960.000000

定性数据的分布分析

数据集

catering_dish_profit.xls

数据集下载地址

菜品ID 菜品名 盈利
17148 A1 9173
17154 A2 5729
109 A3 4811
117 A4 3594
17151 A5 3195
14 A6 3026
2868 A7 2378
397 A8 1970
88 A9 1877
426 A10 1782

img

img

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
[入门数据分析的第一堂课]这是一门为数据分析小白量身打造的课程,你从网络或者公众号收集到很多关于数据分析的知识,但是它们零散不成体系,所以第一堂课首要目标是为你介绍:Ø  什么是数据分析-知其然才知其所以然Ø  为什么要学数据分析-有目标才有动力Ø  数据分析的学习路线-有方向走得更快Ø  数据分析的模型-分析之道,快速形成分析思路Ø  应用案例及场景-分析之术,掌握分析方法[哪些同学适合学习这门课程]想要转行做数据分析师的,零基础亦可工作中需要数据分析技能的,例如运营、产品等对数据分析感兴趣,想要更多了解的[你的收获]n  会为你介绍数据分析的基本情况,为你展现数据分析的全貌。让你清楚知道自己该如何在数据分析地图上行走n  会为你介绍数据分析分析方法和模型。这部分是讲数据分析的道,只有学会底层逻辑,能够在面对问题时有自己的想法,才能够下一步采取行动n  会为你介绍数据分析数据处理和常用分析方法。这篇是讲数据分析的术,先有道,后而用术来实现你的想法,得出最终的结论。n  会为你介绍数据分析的应用。学到这里,你对数据分析已经有了初步的认识,并通过一些案例为你展现真实的应用。[专享增值服务]1:一对一答疑         关于课程问题可以通过微信直接询问老师,获得老师的一对一答疑2:转行问题解答         在转行的过程中的相关问题都可以询问老师,可获得一对一咨询机会3:打包资料分享         15本数据分析相关的电子书,一次获得终身学习
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值