标题在图表上_数据可视化图表

最新推荐文章于 2024-05-15 14:59:37 发布

哎呀吗呀咪呀

最新推荐文章于 2024-05-15 14:59:37 发布

阅读量2.5k

点赞数

文章标签：标题在图表上

本文链接：https://blog.csdn.net/weixin_31834275/article/details/112622582

版权

图表是数据可视化的常用表现形式，是对数据的二次加工，可以帮助我们理解数据、洞悉数据背后的真相，让我们更好地适应这个数据驱动的世界。无论在工作汇报、产品设计、后台设计以及数据大屏中都能看到它的身影。然而，在实际工作中我发现很多初入行的设计师对于图表设计并不是很了解，同时市面上对于这方面的资料相对零散，不成体系。所以我结合了平时工作中的理解，梳理了这篇文章，希望能帮助到大家。

一、图表的组成

1. 图表的构成

当我们把图表的结构进行拆解后，就会发现一个图表是由很多个细小构件组成的，这些构件有自己的名字和用途，分别是标题、轴、图形、图例、标签、提示信息。在平常使用的过程中，会根据场景去修饰删减一些构件元素，以此来减少冗余信息，用最适量的数据墨水比(Data-ink Ratio)，帮助用户快速达成目标，在最少的时间内获取更多的信息。

标题 - 描述图表的主题(包含主标题和副标题)
标签 - 对当前这一组数据进行的内容标注
轴 - 用来定义坐标系中数据在方向和值的映射关系
图例 - 对图形本身的概括
提示信息 - 当tap或者hover的时候，以交互提示信息的形式展示该点的数据详情
图形 - 统计图表的视觉通道在形状上映射的视觉展现

接下来，我会一点一点地为大家讲解它们，方便大家合理的使用它们。但在此之前，我们先来了解一个知识点 - 数据墨水比，以便更好的理解接下来的内容。

2. 数据墨水比

数据墨水比——"data-ink ratio"，是1983年视觉大师爱德华·塔夫特(Edward Tufte)在《The Visual Display of Quantitative Information》中提出的一个概念：一幅图表的绝大部分笔墨应该用于展示数据信息，数据变化则笔墨也变化。他将数据油墨比定义为图表中用于数据的墨水量除以总油墨量。其中数据墨水指的是图表中不可删除的核心内容。比如，我可以删除图例、删除坐标轴、删除网格线，这可能不会影响你从图表中读取相关的信息。但如果我删除柱形图、饼图这些图表的主体元素，那么图表就失去所要表达的内容了。

我个人更喜欢用“信噪比”= 信号/(信号+噪音) 这个概念去理解，因为通过可视化传达的信息不仅仅是数据，还有业务洞察，像观点、结论性的信息往往需要用文字来呈现的也是至关重要。不过无论使用哪个词，最终的目的都是突出传达“信息”部分，去除那些干扰的“噪音”。

因此，图表中的数据墨水占比越多，那么该图表的冗余信息就越少，信息传递效果就越好。所以，在创建图表和图形时，我们的目标应该是在合理范围内最大化数据墨水比。

二、图表元素详解

1.标题

一个明确、相符的标题可以迅速让读者理解图表要表达的内容。通常图表的标题是根据图表所需要表达的内容决定的，大多数小伙伴可能认为命名没有太多问题。但当这个图表的结论是单一且唯一的时候，建议在概括图表内容的标题中加入结论性的信息点。这样能减少读者误解你的意图的可能，而且能够确保他们将注意力集中于你想着重强调的数据上。

2. 轴(坐标轴)

2.1 定义

轴是能够使每个数组在维度空间内找到映射关系的定位系统，更偏向数学/物理概念。换句话说，轴的功能像是把可视化对象置于共同的基准上，再以标尺进行数值量测。在数据可视化中，一般存在于笛卡尔坐标系(直角坐标系)和极坐标系中。对轴进行「原子」要素的拆分，我们可以得到以下几种元素，分别为：轴线、轴刻度线、轴标签、轴标题(单位)以及网格线。

2.2 分类

根据对应变量是连续数据还是离散数据，轴可以分为：分类轴，时间轴，连续轴。

2.3 使用建议

2.3.1 轴线

轴线一般只考虑是否显示，结合上面所讲的数据墨水比，在有网格线的情况下，柱状图/折线图会隐藏 y 轴线，条形图则是隐藏 x 轴线，以达到信息降噪，突出视觉重点的目的。

2.3.2 轴刻度线

轴刻度线是轴线上的小线段，可以提供数值标签在坐标轴上的明确位置。轴刻度线有3种类型，分别为：置内、置中(即交叉方式)、置外。但刻度应置于数值坐标轴外侧，不建议刻度采用置中或置内方式显示。

轴刻度线的使用就是加强映射关系，快速的对应到数据点。分类轴较多出现在柱状、条形中，对于映射有天然的对应关系，故在分类轴中习惯隐藏轴上的刻度线。

2.3.3 网格线

网格线是用来辅助图表优化映射关系的。使用网格线可以增加数据的可阅读性，网格线提供了两种功能：一是延伸数值刻度至可视化对象中，以便观察数据值之大小；二是增加可视化对象之间的比较基础，利于比较。

网格线一般跟随值域轴的位置单向显示，柱状图采用水平网格，条形图采用垂直网格。在使用网格线时，应该注意遵从主次原则，以轴线为主，网格线为辅，样式上可采用实线或者虚线。避免颜色过重，不要使用纯黑或者纯白，在视觉层级上不能抢了图表中的信息。

2.3.4 轴标题

轴标题(单位)主要用于说明定义域轴、值域轴的数据含义。当可视化图表的其他部分内容(标题、图例、轴标签等)已经能充分表达数据含义，根据奥卡姆剃刀定律，可以略去轴标题，近一步增大数据油墨比，精简画面元素。

2.3.5 轴标签

轴标签的设计较为复杂，涉及到的细节点比较多。这里将围绕直角坐标系的X轴和Y轴这两个方向进行讨论。

X轴标签

x 轴标签的设计重点在显示规则上，在可视化图表设计中，我们常常会碰到轴标签内容过长的情况，当空间有限时，轴标签会重叠在一起。如何处理此类问题，这里根据轴的不同类型给了对应的解决方案。

A. 连续/时间轴标签

在连续轴和时间轴中，我们可以利用抽样显示的手段来优化轴标签重叠的问题。这里不推荐使用旋转来缩减宽度。一方面从美观度上，旋转可能会破坏界面整体协调。另一方面，连续/时间轴并不需要显示所有的轴标签，参考格式塔中的[连续性原理]，尽管轴标签未能完全展示，但用户会在脑海中把缺失的部分补齐，轴标签仍然会像连续着的一样。

B. 分类轴标签

在分类轴中，由于标签与标签之间并没有紧密的逻辑关联关系。若采用抽样规则，隐藏了一些标签，则加大了用户对图表信息的提取难度，这是我们不想看到的。对于分类轴，这里建议通过标签旋转或转换成其他图表(条形图)来缩减宽度。

Y轴标签

y 轴标签的设计重点在标签数量、取值范围和数据格式上。标签显示区域一般根据最长标签宽度自适应缩放。如果数组是固定的，就写成固定宽度，节省图表计算量，提高渲染速度。

A. 轴标签的数量

轴标签的数量不建议过多，太多的标签必定导致横向网格线变多，造成元素冗余，干扰图形信息表达。根据 7±2 法则，Y轴标签数量应尽量控制在这个范围内。

B. 轴标签的取值范围

一般来说，y 轴标签的取值应从 0 基线开始，以恰当反映数值。展示被截断的数据可能会误导用户做出错误的判断。比如数据本身没有那么起伏变化，处理上下限的颗粒度，把刻度拉长，一样能显得“长势喜人”。

从上面就能明白，在看图表的时候千万不要被表面给欺骗，仅仅观看柱状图的高低趋势往往不能得出正确结论，需要注意坐标轴起始位置有没有被人做过虚假处理。

但存在是有根源的，对于此类的取值方式不做过多评价。这里主要想讲一下我常用的取值方式：对于Y轴的上限即最大值根据实际数据进行动态计算。比如一排数字中最大的为1190，那么轴标签最高位为1200；一排数字中最大的是1210，那么轴标签最高位为1400。其中的1400和2100是根据轴上的分段数决定的。

但有些人对Y轴标签的取值给出了如下建议：在折线图中，取值一般保证图形约占绘图区域的2/3，或者将柱状的高度控制在图表高度的85%左右。

但我认为这种方式太刻意了，并且规则定制的比较细。但是得承认这样子确认会显的好看，做案例可以，做真实数据不行。因为考虑到实际数据有的时候会出现极限情况，比如有些特别大有些特别小，为了保证用户能从图表中准确地获取信息，不应该为了美感而破坏了它的真实性。因此并不推荐用这种方式来取值。

C. 轴标签的数据格式

关于Y轴标签的数据格式，这里重点讲一些比较容易忽视的设计细节。第一，标签保留的小数位数保持统一，不要因为某些轴标签是整数值，就略去小数点。

第二，正负向的 y 轴标签，由于负值带“-”符号，整个 y 轴看起来会有视觉偏差，特别是双轴图的右 y 轴更明显。这里建议正负向 y 轴给正值标签带上“+”，以达到视觉平衡的效果。

3. 图例

3.1 定义

图例是对图形本身的概括，在图表元素中属于辅助内容。它提供读者以对照的方式来理解可视化对象的项目归类。由映射图形形状和文本组成。

3.2 类型

根据数据类型不同，分为连续型图例和分类型图例；根据状态不同，图例可以被设置为静态或可交互态。

3.3 使用建议

3.3.1 数字文本取整

正如，伦斯勒理工学院的行为经济学家高拉夫杰恩(Gaurav Jain)所说：“数字有一种语言的力量，能给予人一种特殊的感觉。当我们使用具体的整数数字时，人的衡量会减少。这种行为没有明显的原因。”

当人们的大脑在处理不以零结尾的不规则数字时，需要更多的脑力来处理，加大了获取信息的难度。因此在使用数字时，应该考虑这种偏好，倾向于一些取整的数字。同样的，这不仅仅适用于图例中的数字，同样适用于坐标轴上下限的数字。

3.3.2水平图例和垂直图例

带有连续性的倾向于使用水平图例，因为更符合人们的阅读习惯；带有分类属性的倾向于使用竖直图例，图例的右边可放置更长的文本。

3.3.3 图例的位置

默认把图例放在左上角去做一个通用的方案看起来没毛病。但考虑到人的视觉动线是从上至下，从左到右。这里有一个更好的做法：缩短用户对照图例看图形的本能路径，可以提升对信息的获取效率。如下图所示：

3.3.4 多折线图采用跟随图例

当我们在制作多折线图时，经常会出现个数据系列之间相互交错的情形，并使得各种数据标记与之前的出现顺序不一致，即与图例排列顺序不同。因此用户的眼睛必须在图例与折线之间进行连连看，最佳的做法是采用跟随图例形式，去标识出折线所属于的维值信息，这样会更直观有效。

4. 标签

4.1 定义

在图表中，标签是对当前的一组数据进行的内容标注。包括数据点、拉线、文本数值等元素，根据不同的图表类型选择使用。

4.2 使用建议

4.2.1 标签的显示策略

在绘制的图表的时候，我们倾向将标签直接打在图形外，但在「堆叠类」图表中，标签会显示在图形内。这样做会有个后果，标签的文本和图形经常需要交叠展示，所以可读性需要足够良好，所以通过对 HS 值的判断，决定文字的颜色是否需要反思。这样对比度就在可控范围内，不会出现可读性的问题。有时，还需要增加描边，让标签更清晰。

当数据特别多并且密的时候会造成全部标签挤在一起的情况。在标签重叠时，采用动态计算的抽样显示方式，自动隐藏其中一个，同时当 Hover 图表时，显示被隐藏的对应的数据。这样保证了图表的清晰度，也保证了信息的完整性。

5. 提示信息

5.1 定义

提示信息一般是tap或者hover的时候，图表以交互的方式吐出该位置的数据，帮助用户更深入的了解数据。一般由视觉标记图形，文本标签，数值标记这3中元素构成。

5.2 类型

提示信息的展现形式由4种。按不同的图表类型，分为悬浮、固定位置、固定在轴上、固定在图形上。

6. 图形

6.1 定义

人类从图形中获取信息的效率远高于文本，可以说如今人类早已进入了读图时代。图形是统计图表的视觉通道在形状上映射的视觉展现，是图表的必备元素，承载着数据背后蕴含的信息。按照组件原子化的思路来定义现在千奇百怪的图表，大致可以分为六种基础样式：折线，面积，散点，气泡，饼/环，柱形，条形。

6.2 使用建议

这里主要想重点讲一下，如何通过设计来强化图表信息的表达，以便简化用户获取信息的成本。关于具体某个图表的制作规范和运用场景，会在之后的文章中提及。

6.2.1 改变颜色 - 明暗/深浅/色彩对比

通过明暗对比、颜色对比以及色彩对比等手段可以有效的区分信息，在视觉层级上也是明显的处理了视觉噪音，便于用户区分信息。

6.2.2 添加标注

通过添加标注，人为去干预信息的表达，多用于一前一后的标识，便于用户识别信息。

三、选择合适的图表

我们做数据分析的有句话叫“一图胜千言”，图表是展现数据的一种重要展现形式，选对了图表就能帮助我们更加快速、直观的传达数据信息。

那如何挑选合适的图表呢？在我看来大致分为三步：

1. 确定核心内容：明确要用图表传达的核心信息；

2.判断比较关系：判断数据之间的比较类型(如占比、数量、趋势等)；

3.选择图表类型：选择对应含义的图表(如饼图、柱状图、折线图等)。

很多朋友在判定和选择图表类型时会不知所措，但其实你只需要记住一句话：决定图表形式的不是数据，而是你要传达的信息。

1. 确定核心内容

同一组数据用不同的角度看，有不同的主题，比如下面这组数据：

从另一个角度看同样是5月份的数据，你还可能会将侧重点放在每个产品占销售额的百分比上。那你的图表主题应该是“5月份，产品 A 占公司产品总销售额的比例位居首位”。

综上所述，选择合适图表的关键，最初也是最重要的，就是明确要用图表传达的核心信息。

2. 判断比较关系

在实际工作中需要用图表反映数据的场景五花八门，但按数据关系分类无非以下几种情况，给大家简单举几个例子：

“预计在今后 10 年多的时间里，销售额将增长 ”对应的关系为时间趋势；
“雇员的最高工资额在 30000 到 35000 美元之间 ”对应的关系为频率分布；
“汽油并不是牌子越响价格越高其性能就越好”对应的关系为相关性；
“9 月份里，6 个区域的营业额大致相同”对应的关系为排名对比；
“销售部经理在他的领域内只花费了他 15% 的时间”对应的关系为占比。

3. 选择图表类型

国外专家Andrew Abela曾整理了一份图表类型选择指南图示(如下图)，他把数据的关系分成了4种类型，帮助我们去选出合适的图表来呈现。

但其实结合我自己的经验，考虑到日常企业的数据分析场景，图中有些图表使用频率是非常低的。所以我参考了上图的部分内容，对其进行了总结，替换掉了一些图表并对其进行了美化，总体上我认为这是会更适合商务图表展示，而且会更接地气，适合大家参考使用。

四、常见的可视化图表

1. 折线图

1.1 定义

折线图是通过线条的波动(上升或下降)来显示连续数据随时间或有序类别变化的图表，常用于反映数据随着时间推移而产生的变化趋势。

2.2 适用场景

横轴为连续类别(如时间)且注重变化趋势、预测，适用于折线图。

举个例子：比如想看2020年上半年商品的营业额情况，并对走势做一个分析。由于每个月份的商品营业额相关的，它们代表一种数据在不同时间下的数据值，因此我们可以用折线图将它们连接起来。

但如果想看2020年上半年北京、上海、广州、深圳、南京五个省份的营业额情况，由于每个省份的营业额是不相关的，所以我们不能随便用折线图来替代柱状图。

2.3 使用建议

2.3.1 使用合适的时间间隔，使锯齿状的线条平滑

如果折线图上下浮动过于剧烈，那么可以尝试拉长时间间隔，比如不每天采样而以周为单位来采样。用户不太原因去阅读锯齿状的线条，或者说他们不会喜欢这样的图表。

但是如果有强需求说是一定要在某个范围，这条略过。

2.3.2 善用数据点标记、特殊标记

当有些特定的数值特别重要时，我们可以在线条上标注出他们，但全部标清数据点在大多数情况下标记出来的意义不大，从视觉上来看会显得非常琐碎。

2.3.3 分清主次关系，加强数据感知

若对比数据较多，为了避免信息繁杂。可采用实线的强弱和色彩的对比来区分主次内容，让用户更关注在主折线，获取主数据的波动感知。

知识扩展：折线图与曲线图的区别

折线图：更关注于点的数据，相对短的一段时间数据随时间变化的趋势；

曲线图：更关注点构成的线点数据，一段时间内整体数据随时间变化的趋势。

曲线图是折线图中的一种，当图表数据点过于密集时，使用曲线图更能表达数据随时间变化的趋势、周期性。