第七章、可视化分析图表(1)

第七章、可视化分析图表(1)


业务分析工作的最终产出结果主要包括分析报表与分析报告两部分内容。

根据使用方式的不同将各种图表归类为比较、序列、构成及描述4种不同类别。


 

一、比较类图表

      比较类图表主要用于在实际值与目标值之间、不同对象之间或者不同区域之间进行数值结果的对比分析。比较类图表是这4类图表中种类最多、应用最为广泛的。


1、实际值与目标值之间的对比。在实际工作中经常使用油量表圆环百分比进度图等图表对实际值与目标值之间的对比结果进行展现。

例如,用来描述销售人员目标完成进度水平的销售目标完成率(销售目标完成率=销售金额/销售目标×100%)就非常适合使用油量表或圆环百分比进度图进行展现。


2、对象与对象之间的对比。该类别下的图表主要用于对不同对象之间度量值结果的大小差异进行展现。常用到的图表类型有柱状图(又称柱形图)、条形图、雷达图、词云图与树状图等。

柱形图和条形图是该类别下应用较为普及的图表类型。

柱形图和条形图:

(1)两者主要区别在图表的展现方向上。柱形图将业务坐标轴(对象坐标轴、维度项坐标轴)作为横坐标轴,将值坐标轴作为纵坐标轴。而条形图与柱形图相反,将值坐标轴作为横坐标轴,将业务坐标轴作为纵坐标轴。我们可以根据摆放图表时的空间位置特征来选择合适的图表。例如,若空间位置适合摆放横向布局的图表,则推荐使用柱形图:若空间位置适合摆放纵向布局的图表,则推荐使用条形图。


(2)两者在使用习惯上也存在差异。一般在使用柱形图时,习惯根据对象间的逻辑顺序而并非对象间度量值结果的大小顺序对对象进行排序。


在描述对象间度量值结果的大小差异上,词云图与树状图这两种图表凭借各自显著的优势特征在众多比较类图表中脱颖而出。

词云图的优势特征是将文字与数值两种不同的信息完美结合在一起,直接用文字的大小反映文字背后数值结果的大小,起到突出重点对象的作用。

词云图除了具有上述较为明显的优势特征,它的劣势特征同样非常突出。词云图一口气将所有对象文字挤在一起呈现在阅读者眼前,其中数值结果较小,也就是字体较小的对象很容易被阅读者忽略,导致无法完整地向阅读者传递信息。

树状图也是近年普及程度较高的比较类图表之一。

树状图的优势特征在于可以同时展现两类不同对象的数值结果对比情况,提高了信息传递的完整
性及多样性,使阅读者能够从一个图表上轻松获取到更加丰富的信息内容。

无论是词云图还是树状图,都是在不同业务维度项下对某一种特定度量值结果进行对比时使用的图表。

比如在用词云图对比不同产品子类别间的订单金额合计值时我们使用了如图7-6所示的图表。在该图表中参与对比的对象是产品子类别维度下的多个不同产品子类别维度项,而对比的度量值是订单金额合计值这一种度量值结果。如果我们想对比同一个维度下多个不同维度项在多种不同度量值结果中的差异情况,则需要使用雷达图来加以实现。

对比雷达图

雷达图是在多种不同度量值为顶点构成的坐标系内,对某一个维度下不同维度项间的差异水平进行对比时使用的图表。

使用雷达图时要注意以下3点:
(1)在为雷达图选取度坐标轴中的顶点度量值时,度量值个数不宜过多,最好能将雷达图的顶点个数控制在8个以内,因为过多的顶点个数会增加图表的理解难度,容易造成阅读者对重点信息的忽视,以及对维度项特征的误读。


(2)尽量将相同属性的顶点安排在同一个方向上。例如,如果为某款游戏的不同角色的能力水平制作雷达图,我们可以先将物理攻击力、魔法攻击力等描述角色攻击水平的顶点放在左侧,然后将物理防御力、魔法防御力等描述角色防御水平的顶点放在右侧,如果某个角色的折线组合在雷达图中偏向左侧展开,那么我们就可以轻松判断出该角色是强于进攻的角色。


(3)在制作雷达图时一定要先为每一个不同度量值的顶点统一单位,也就是进行顶点度量值的标准化处理,只有经过标准化处理后得到的单位统一的数据才能作为雷达图参照的数据源。


在一般情况下,我们可以使用最小值-最大值标准化法(MIN-MAX标准化法) 对雷达图顶点的度量值进行标准化处理。该方法的计算公式为:标准化后的结果=(实际值-最小值)/(最大值-最小值) 


如果一组数中的实际值是这组数的最大值,则计算结果为"1":反之,如果实际值是这组数的最小值,则计算结果为"“0”,通过该公式分别计算每个不同单位下的度量值,就可以将所有度量值全部压缩在0~1的数值区间内,这样就可以达到统一单位的目的了。


3、区域与区域之间的对比。

在实际工作中,我们经常要在不同地理区域下对数值结果进行对比,此时可以使用数据地图对对比情况进行展现。在工作中常用到的数据地图有3种不同的呈现形式,分别是染色地图、热力地图及散点地图

染色地图和热力地图使用渐变色对数值大小进行展现,越接近渐变色的浅色部分代表数值越小;反之,越接近渐变色的深色部分代表数值越大。

染色地图常用于对行政划分范围较大的区域进行展现,比如在中国地图中对各个省份区域下的GDP数值大小进行展现时可以优先选择使用染色地图。

热力地图比较适合对非行政名称的地理区域下的数值结果进行展现,比如对各不同山脉的海拔高度变化进行展现时可以优先选择使用热力地图。

散点地图又被称为气泡地图,是通过散点、气泡(此处的散点与气泡是相同意思)的大小关系来描述不同区域间数值结果的大小差异情况的图表。散点地图适用于对行政划分范围较小的区域进行展现,比如对中国地图中各个不同城市常住人口的人数进行对比时可以优先选择使用散点地图。

二、序列类图表


序列类图表主要用于对某些对象行为结果的时间变化趋势特征进行描述,或者对某个事项的开展过程特征进行描述。对于前者的描述经常使用折线图、面积图或柱形图,而对于后都的描述常用到漏斗图。

折线图、面积图、柱状图

虽然在图表的传递内容上3类图表几乎没有区别,但是,在使用习惯上,3 类图表还是有所不同的。当横坐标轴是连续的时间点时,一般选择折线图或面积图进行使用;当横坐标轴是有间隔的时间段时,一般选择柱形图进行使用。

因为折线图和面积图使用的是连续的线段组合或是面积区间,所以从图表本身的展现效果上,折线图和面积图更能突出时间变化的连续性特征,比较适用于对连续时间点下的变化趋势进行展现。

而柱形图使用的是有宽度且不连续的柱子,在展现效果上更能突出时间段的不连贯性,所以柱形图一般适用于对有间隔的时间段下的变化趋势进行展现。

漏斗图


三、构成类图表


构成类图表主要用于对部分在整体中的占比大小进行描述,或者对行为结果中不同行为阶段的影响程度进行描述。前者主要使用饼图、环形图等图表进行展现,后者主要使用瀑布图进行展现。

饼图、环形图、南丁格尔玫瑰图、堆积图、百分比堆积图

饼图和环形图与柱形图和条形图最大的区别在于,柱形图和条形图强调的是不同对象间的大小关系,属于比较类图表。而饼图和环形图强调的是部分在整体中的占比关系,属于构成类图表

饼图常用于结构分析。饼图是将饼(圆形)按照各类别数据在总数据中所占比重进行等分,用于展示各类别比重结构状况,在各饼处可以标注数据的频数或频率情况,对于多个类别的数据,需要添加图例注明图中各部分代表的类别。分类数据、顺序数据和数值数据均可以使用。

将饼图改进,中间挖空,得到环形图,环形图可以同时展示多个总体或样本的数据,多个总体或样本的环形图可以进行多总体或样本数据的对比分析。

饼图的扇区越大,强调的不是数值越多,而是这个扇区在整体构成中占比越多,重要程度越高。使用饼图或环形图时需要注意,构成饼图和环形图整体下的各个部分加在一起应该构成一个完整逻辑意义上的墪体。


瀑布图

构成类图表中除了包含描述部分与整体间的构成关系的饼图与环形图,还包括描述业务行为阶段与业务行为结果间的构成关系的瀑布图。

使用瀑布图可以直观展现出每个行为阶段对最终行为结果的影响程度。



四、描述类图表


描述类图表主要归类的是描述性统计类图表,该类别下的图表主要用于对数值分布情况及数值变量间的关联关系进行描述。前者主要包括直方图及箱线图,后者主要包括散点图

直方图是数值数据的图,将数据按照分组情况画出各组的直方,通过观察直方的变化情况,可以初步确定数据的分布形态。

直方图与柱形图很像,区别在于柱形图是分类数据的方法,其横轴为类别轴,各类别之间无固定顺序,故各类别间需要问隔开;而直方图是数值数据的方法,其横轴为数轴,需要按照数轴的顺序排列且数据要求连续,故各直方中间无间隔。

散点图


散点图常用于描述变量间的相关关系,其横轴表示一个变量,纵轴表示另一个变量。根据个体数据在图中描点,得到的图就是散点图。

需要注意的是,散点图的各个散点之间不能连线,这与线图不一样,线图的各点之间有时间顺序,故可以连线,而散点图的各散点之间没有固定的顺序,故不能连线。

箱线图

箱线图(也有人称为盒须图)由一个箱子、两条线构成,可以横置也可以竖置(通常采用竖置的箱线图)。

竖置时上面一条线的顶端表示该组数据的最大值,下面一条线的底端表示该组数据的最小值,中间的箱子上端为该组数据的上四分位数,下端为该组数据的下四分位数,箱子的中间有一条横线表示该组数据的中位数。

由于箱线图由数据的最小值、最大值、上四分位数、下四分位数、中位数5个指标构成,因此在实际数据分析中箱线图常用来观察数据分布特征

由于箱线图中最大值和最小值可能是极端值,为避免极端值影响数据分布特征的观察,因此在制作箱线图时,常先剔除极值再制作箱线图。


箱线图的上面一条线的顶端和下面一条线的底端的距离就是极差,可以用来反映极端值之外的数据范围;中间箱子的高度,就是四分位差,可以用来反映处于中间50%数据的分散情况。

从中位数的位置可以看出数据的分散情况,若中位数在“上面一条线的顶端和下面一条线的底端”中靠下方,则表明前半数据集中,后半数据分散;反之就是前半数据分散,后半数据集中。

若中位数在“箱子的上端和箱子的下端”中靠下方,则表明数据中间一半的数据的前半数据集中,后半数据分散;反之就是数据中间一半的数据的前半数据分散,后半数据集中(竖置的箱线图对应纵轴,靠下方的数据是前半部分数据)。

  • 28
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值