本篇内容为数据分析入门方法系列的第3篇,平均和交叉的思路,有需要回顾前两篇方法的,传送门在这里:《分组分析法》《对比分析法》
本文大概
1435
字
读完共需
4
分钟
之前两篇内容提到了对比和分组,这都是实际工作中经常用到的,只是你没有把它好好总结出来,今天要分享的平均分析法和交叉分析法同样是工作中随处可见的分析方法,希望我们能学会并用好。
一、平均分析法
平均分析法顾名思义,就是用平均数来反映数据在某一特征下的水平,平均分析通常和对比分析结合在一起,从时间和空间多个角度衡量差异,找到其中的趋势和规律。
01 不得不提的平均数平均数用来反映一组数据的集中趋势,表示平均的指标有算术平均数、几何平均数、中位数和众数。
算术平均数
最常用的一个平均数,也就是常说的均值、平均值,就是我们熟悉的那个求平均值的公式,所有的数值相加再除以总个数:
算术平均数受极值的影响较大,当数据集中出现极端值时,所得到的结果将会出现较大的偏差,如计算一个企业员工的平均收入,因为老板的收入太高了,导致平均值被拉高,出现了整体收入的平均值偏高的现象,我们经常说的工资收入被平均,就是这个道理。
在Excel里用AVERAGE()函数来计算
几何平均数
几何平均数在计算增长率、收益率等比率和指数进行平均时应用比较广泛,受极端值的影响较小,几何平均值是所有数值乘积开n次方根,在计算几何平均数的时候,不可以有0和负数,公式为:
在Excel里用GEOMEAN()函数来计算几何平均值
中位数
上面讲算术平均数的时候举了一个收入被平均的例子,如果因异常值的出现而无法用算术平均数来描述数据的话,那应该用什么指标来描述呢?对了,就是中位数和众数。
中位数是将数据按照从小到大的顺序排列,最中间的那个数据即为中位数。
中位数的寻找方法:
当数据个数为奇数时,中位数即最中间的数;当数据个数为偶数时,中位数为中间两个数的平均值。中位数不受极值影响,因此对极值缺乏敏感性。
在Excel里用MEDIAN()函数计算中位数
众数
众数是数据中出现次数最多的数字,即频数最大的数值。在一组数据中众数可能不止一个,众数不仅能用于数值型数据,还可用于非数值型数据,且不受极值影响。众数通常用来反映一组数据的一般水平,如某次考试中学生的集中水平、城镇居民的平均生活水平等。<