本篇文章可以让你学到Excel基本可视化的所有图形,以及各个图形对应的特性和应用场景,注意事项等。让我们愉快的开始学习吧。GoGoGo!!!
1、主题
学习此篇用到的Excel2016版本。
文章主要通过简单的案例总结学习条形图、柱状图、折线图、散点图、饼图、环形图、箱线图等基本可视化⽅案的信息表现⽅式、使⽤场景及可视化实现⽅法。
2、学习目的:
了解excel各个作图功能区域,了解各模块功能和相应操作实现。
- 掌握excel作图功能区相应操作。
- 掌握各类可视化图形的特征和信息展示⽅式。
- 掌握图形制作的基本流程和⽅法。
图表的选择
:确定要表达的信息→确定相对关系→选择图表形式。- 从多个维度观察数据,明确要表达或分析的主题。
- 明确要表达的数据之间的关系(突出重点)。
- 梳理数据关系,并根据数据特征、数据关系选择合适的可视化图表。
可视化实现
:选择数据,完成基本图形→调整⼤⼩⽐例→润⾊(颜⾊、⽹格线、背景⾊)→增加图例坐标轴单位和标题。
3、柱状图与条形图
3.1 图形简介
柱状图是使⽤垂直的柱⼦显示类别之间的数值⽐较,其中⼀个轴(⼀般横轴)表示需要对⽐的分类,另⼀个轴(⼀般纵轴)表示相应分类下的数值表现。
条形图是柱状图的转置,⼯作中柱状图使⽤居多。
3.2 基础用法
柱状图或条形图描述的是分类数据,回答的是每⼀类中“有多少?”的问题。
此外柱状图也可以⽤于展示
时序数据的趋势变化; 需要注意的是,当柱状图显示的分类很多时会导致分类名称重叠等情况,该情况可考虑⽤条形图代替。
柱状图主要展示对⽐差异,如果是时间序列可以考虑柱状图展示趋势,此外条形图多⽤在排名的可视化展示中。
柱状图常⽤的⼏类图形
单⼀柱状图
:反映单⼀类别数据对⽐,或时序数据趋势。并列柱状图
:展示两类及以上数据的对⽐,也可展示变化趋势。堆叠柱状图
(不建议分类超过5类,超过时可以选择最重要的分类,不重要归为"其他"处理)。普通堆积柱状图
:展示数据的内部结构分布和整体的变化情况。百分⽐堆积柱状图
:展示整体内部的相对占⽐和变化趋势。
3.3 常用图形
单一柱状图:
并列柱状图:
条形图:
普通堆叠柱状图:
百分⽐堆积柱状图:
4、折线图和⾯积图
4.1 图形简介
折线图
⽤于显示指标在连续时间间隔上的变化,特点是反映变量随时间或有序类别的变化趋势。
4.2 基础用法
折线图中,数据是递增还是递减、增减的速率、增减的规律(趋势性、周期性、螺旋性、随机性等)、峰值、凹值等特征都可以被清晰地展示。
所以,折线图常⽤来分析数据随有序变量(时间)的变化趋势,也可⽤来分析多组数据随时间变化的相互作⽤和相互影响。
例如可⽤来分析某类商品或是某⼏类相关商品随时间变化的销售情况,进⽽预测未来的销售业绩、分析GDP随年份的变化趋势等。
在折线图中,⼀般⽔平轴(横轴)⽤来表示时间或有序维度的推移,并且间隔相同;⽽垂直轴(纵轴)代表不同时刻和维度的数据表现。
特点:可以反映变量的周期性、趋势性、季节性、随机性等,通过折线可以对变量的变化规律有全⾯的认知和预判。
折线图常⽤⼏类图形
- 折线图(单折线与多折线)
- 点线图(折现与点的组合)
- 曲线图
- 变体⾯积图
普通堆积⾯积图
:反映整体和整体中各部分随时间的变化趋势。百分⽐堆积⾯积图
:分析整体中各部分随着时间的占⽐变化趋势(类⽐堆积百分⽐柱状图)。
4.3 常用图形
折线图:
点线图:
普通堆积⾯积图:
百分⽐堆积⾯积图:
5、饼图与环形图
5.1 图形简介
饼图或环形图⽤于展示分类数据中各分类占整体的⽐例,⽤饼图或环形图的⾯积或弧⻓展示各类别占整体的多少,更多的⽤于展示静态分类数据(与时间序列数据区别)分布。
注意只能⽤各分类加总等于整体的数据类型,对于去重的数据不适⽤。
5.2 基础用法
有饼图、环形图、⼆维饼图等多种类型,⽤饼图的⾯积或圆⼼⻆度⼤⼩代表相应的分类数据的数值⼤⼩。
饼图和环形图的主要缺点:
饼图不适⽤于多分类的数据,原则上⼀张饼图不可多于 6个分类,因为随着分类的增多,每个切⽚就会变⼩,最后导致⼤⼩区分不明显,每个切⽚看上去都差不多⼤⼩,这样会失去使⽤饼图的意义。所以饼图不适合分类很多的情况。
相⽐于具备同样功能的其他图表(⽐如百分⽐柱状图、环图),饼图需要占据更⼤的画布空间。很难进⾏多个饼图之间的数值⽐较。
饼图和环形图⼩技巧:
- 超过6种的分类将不重要的归为“其他”⼀类。
- 最重要的类别放在12点钟⽅向。
- 同等重要就按照从大到小排列。
- 环形图中间是空的,可以放置标签、整体数据、平均数值或其他内容等,其信息表达方式与饼图类似。
5.3 常用图形
平面饼图:
立体饼图:
环形图:
子母饼图:
圆环图:
6、散点图与⽓泡图
6.1 图形简介
散点图
⽤来展示或探索变量之间的变化关系,也经常⽤来展示数据点在直⻆坐标平⾯上的分布,散点图也可表示因变量随⾃变量的变化情况,通常在做拟合、回归时会先做散点图初步确定拟合函数。
⽓泡图
可⽤于展示三个变量之间的关系也可⽤于展示两个变量之间的关系。它与散点图类似,绘制时将⼀个变量放在横轴,另⼀个变量放在纵轴,⽽第三个变量则⽤⽓泡的⼤⼩来展示(⽓泡的⼤⼩是⽤⽓泡的⾯积进⾏映射的);两变量时,分类变量放在横轴,数值变量放在纵轴,⽓泡的⼤⼩和⾼度代表数值变量⼤⼩;⽓泡图也可⽤于分析数据之间的相关性。
6.2 基础用法
散点图⼀般⽤于研究两变量的关系,对应的数据形式为(x, y),⽓泡图除了具备散点图的功能外,可以⽤⽓泡的⾯积映射到第三个维度数据,对应的数据形式为(x,y,z),散点图多⽤于研究数据的分布规律和相关性,并不侧重描述具体每个数据点的取值。
6.3 常用图形
散点图:
气泡图:
6.4 应⽤场景
- 关系数据探索(譬如通过散点图探索年龄与平均⼿机使⽤时⻓)。
- 多变量映射,⽤于分析数据的相关性(譬如上⾯营销费⽤与DAU的关系)。
- ⽓泡图和地图的结合使⽤,⽤于在地图上展示不同地区某些变量的度量⼤⼩等情况(较多)。
7、箱线图
7.1 图形简介
基础箱线图,⼜称盒须图、盒式图或箱型图,是⼀种⽤作显示⼀组数据分布情况的统计图。
7.2 基础⽤法
如果⼀个数据集中包含了⼀个或多个分类变量,同时分类变量对应的多个离散变量,那么可以⽤箱线图展示离散变量会如何随着分类变量的变化⽽变化,也可⽤以展示不同分类变量下的数据分布结构。
箱线图⽤5个数字对分布进⾏概括,即⼀组数据的最⼤值、最⼩值、中位数、下四分位数和上四分位数。对于数据集中的异常值,通常会以单独的点绘制(异常值⼀般为较⼤或较⼩的个别值,⼀般为上下四分位点的1.5QR Inter-Quartile Range内距,)。
箱形图多⽤于数值统计,虽然相⽐于直⽅图和密度曲线较原始简单,但它不需要占据过多的画布空间,空间利⽤率⾼,⾮常适⽤于多组数据分布情况的⽐较。
我们单独拿出来小米来看下它的箱线图,以及对应四分位数的计算方式:
第一种方法:
第二种方法:
还有Excel自带的公式来计算四分位数:
=QUARTILE.EXC
QUARTILE.EXC函数的功能:
在指定数据集且基于0到1百分点值的情况下,计算指定的的四分位数。
QUARTILE.EXC函数的语法结构:
QUARTILE.EXC(array,quart)
array是指定数据集,quart是(1,2,3),代表几分位数。
第三种方法:
=QUARTILE.INC
QUARTILE.INC函数的功能:
在指定数据集的情况下,根据0到1的百分点值返回四分位数。
QUARTILE.INC函数的语法结构:
QUARTILE.INC(array,quart)
7.4 应用场景
- 对⽐各组数据的分布情况。
- 检测数据中的异常点或者离群值。
8、总结
- 上市互联⽹公司通⽤披露指标
- 交易额&订单量(加总)
- DAU (Daily Active User) &MAU (Monthly Active User)去重
- MTU(Monthly transaction user) &ATU(Annual transaction user) 去重
- 数据类型总结
- 趋势型:变量的变化趋势,常⻅于时间序列数据。
- ⽐例型:总体上各内部分布的⽐例。
- 对⽐型:多组数据之间的对⽐,多⽤于分类数据或时间序列数据的对⽐。
- 分布型:数据之间的分布情况,譬如单变量的分布(离散程度、集中趋势、偏峰度等)和多
变量的关系分布。 - 关联型:数据之间的互相关系,譬如分层关系、联结关系、包含关系等。
- 地理型数据:多和地图和图表结合使用。
- 可视化过程中要注意的
- 可视化重要的不是图形本身,⽽是如何通过恰当可视化⽅案传递出数据背后的信息。
- 选择何种图形依赖于数据现状和分析者要传达的观点。
- 可视化过程中遵循少量原则,⼀个图形中所表达的信息不要多于三部分。
数据参照:开课吧数据分析课程