不可不知的分组分析法

本篇内容为数据分析入门方法的第二篇,第一篇对比分析传送门在这里。

分组分析是将总体数据按照某一特征性质划分成不同的部分和类型进行研究,从而深入分析其内在规律。

 

一、为什么要分组?

对于大量的数据,如果不进行分组是很难发现其中规律,找到不同组别之间的关系,从而更好地对比,如下图的人口分布图,如果不对人口的年龄段进行分组,是没法进行分析的。

(图片来源:中国统计局)

 

二、文本数据的分组分析

文本数据即非数值型数据,对文本型数据进行分组可以说明事物的特征,如对性别、教育水平等指标进行分组。

(图片来自中国统计局-国家数据)

 

三、数值型数据的分组分析

01 指令型分组

对于一组数据,有依据地划分好范围的分组方式,是指令型的分组,如个人所得税的税率计算表就是把工资划分为几个规定的区间。

02 组距式分组

不指定分组区间,同时数据量又较大时,可以使用组距的方法进行分组,就是将数据按照组数与组距划分为若干区间,其实和做直方图是一样的。

  • 组数:统计数据的时候,把数据按照不同的范围划分为多少组的个数是组数。组数具体取值多少,可以人为地依据数据本身分布的特点进行限定。分组数不宜过多或过少,一般在5~12个为宜。

  • 组距:一个组中最大值与最小值的差为组距。组距的确定方法:(最大值-最小值)/组数

 

步骤:

Step1:计算一组数据的组数和组距

我们要算出这组数据的个数,最大值、最小值、平均值、极差(最大值-最小值)、组数和组距。相应的公式如下图所示。

这里提供另外一种直接生成数据描述性统计分析的值的方法,Excel——数据分析 工具库——描述统计 分析工具,直接生成关于一组数据的“描述统计”分析工具用于生成数据源区域中数据的单变量统计分析报表,组数和组距还是要手动公式输入,这里的描述性统计分析只是用来提供有关数据趋中性和易变性的信息。

 

如下图所示,输入区域为A例,也就是数据源一列,汇总统计在F列,可以发现汇总统计的和我们公式算的结果是一致的。

 

Step2:分组

然后进行分组,第一组下限值要比最小值小一点,第一组上限值为第一组下限值+组距,如下图

分组完成后求每组的频数,可以用公式FREQUENCY,选中J2到J14单元格,输入下图公式,再按“Ctrl+Shift+Enter”组合键,即可求出每个分组的频数。

还有一种方法不用输公式,可以直接得到频数,选择【数据分析】——【工具库】——直方图,输入区域是生成的随机数,接收区域是分组。

输入区域是数据源一列,接受区域是分组一列。

可以得到如下图所示的频数分布表和直方图,可以看出和我们公式算的频数一致。

 Step3:绘制图直方图

设置数据系列格式,将间隙宽度调小。

最后微调把图表美化一下。

 

四、用数据透视表分组

这是一组每天销售额和销售数量的统计表,可以看出日期一列的时间跨度非常大。我想统计每个季度、每年的量,可以用数据透视表来实现。

 

【插入】——【数据透视表】,把日期拖到行标签,把销售额拖到值区域,汇总方式选择求和。

点开年前面的+号,还可以显示每季度的统计数据。

 

不想让它们分组了怎么办,右键【取消组合】,就回到原始的状态了。

 

 又想组合了怎么办?还是右键【组合】,可以选择想要组合的方式,这里我们按年和季度进行组合,就又回到了最初数据透视表的状态了,还可以自定义组合的数据。主要是让大家知道数据透视表里组合功能的使用。

这个系列会写一些入门级的分析方法,工具的运用都大同小异,思维的不同决定个体的差异,希望大家能get到其中的奥秘。


提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。

相关内容:

SQL学习:MySQL入门 | 库/表/记录的增查删改

Excel分析方法:时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析 

Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图

Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数

用Excel进行数据分析:数据获取 | 数据处理 

方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧 

如果你觉得有用,请点击右下角 在看 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

进击的可乐!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值