关闭

"数据可视化”看这篇文章就够了

标签: 数据可视化数据科学家创意软件架构
812人阅读 评论(0) 收藏 举报
分类:
管理者先要了解基本原则:何时需要柱状图图?颜色超过多少种会太花哨?图例往哪放?Y轴是否从0开始?视觉化的“语法”重要且有用,但掌握语法并不能保证做出好图表。视觉化的第一课,是学会在没有战略的情况下去实践——准备开启目的地未知的旅程。

视觉传达不是一个孤立的行为,而是几个连续的事件,分别需要不同的计划、资源和技能。我们需要一种思考方法,来从整体上认识日益重要的视觉传达科学。

两个基本问题:信息性质和传达目的

开始学习视觉化思维,首先要思考视觉传达的性质和目的:

我要传达的信息是概念还是数据?

我在陈述某事还是探索某事?

如果你能回答这两个问题,就可以安排所需资源和工具,并分析哪类视觉化能最有效地达成目标。

第一个问题相对简单,答案一般很明显。你想呈现的要么是定性信息,要么是定量信息:理念或数据,两者必居其一。但要注意,这里问的是信息本身,而不是你最终采取的视觉传达形式。例如,著名的技术成熟度曲线采用了线状图这一传统的数据表达形式,但并不包含实际数据——它传达的是概念。
如果第一个问题是关于你掌握哪类信息,第二个问题则确定你要怎么做:或是传达信息,即陈述;或是分析某事,即探索。管理者最常用陈述方法,一般是在正式场合向观众传达信息。如果你想利用手中的大量数据报告每季度销售情况,你的目的就是陈述。

但假设老板想知道为什么最近销售表现不佳。你猜测可能是因为季节性波动,但不能肯定。于是,视觉化的目标变为探索:利用同样的数据,你要用图表来证实或否定你的假设。如果假设被证实,你可以再做陈述型图表,告诉老板,“销售出现问题的原因在这里”。

实际上,以探索为目标的视觉化有两种。其中一种是上面例子中的假设检验。但假如你对销售业绩下滑的原因毫无头绪,提不出任何假设呢?你就要仔细分析数据,寻找其中的规律、趋势和异常。例如,对比销售业绩和销售员负责区域面积,你有何发现?不同地区的季节性波动有何异同?天气对销售造成哪些影响?这种开放性探索能带来新发现。开放性视觉探索,将有助于解答宏观的战略问题,如收入为何下降、效率如何提升、客户与公司应如何互动等。

视觉化的四种类型

根据上述两个基本问题的答案,我们可以用一个四象限图来定义视觉传达的四种类型:

概念描述、创意挖掘、视觉探索、日常数据视觉化。

1概念描述视觉化的4种类型
这一象限可以说是“咨询顾问专区”。咨询顾问免不了和各类图表打交道,而图表可以利用容易理解的符号(树、桥)和形状(圆圈、分层),来传达复杂的概念。组织结构图和决策树就是典型的概念描述型图表,眼前这个概括性的四象限图也是。

以描述概念为目标的视觉设计必须简洁清晰;但由于必须使用符号,常会出现过度美化的问题。因为概念本身并不包含数据的性质和范围,它们必须单独表示出来。

这类视觉传达的重点是结构和逻辑的清晰度,最重要的技巧与编辑文章所需的要领类似,即抽象概括事物本质。设计技巧也会有用,你可以自己动手或请人来做。

假设一家企业请咨询顾问来帮助研发团队从其他行业寻找灵感。咨询顾问使用“金字塔搜索”方法,即从邻近领域开始,通过接力层层向外拓展,找到不同领域的顶尖专家。

由于解释起来比较繁琐,咨询顾问可以运用视觉化方法。金字塔搜索的原理是什么?如下图所示:

横纵轴的设置使图表非常容易理解:行业从左到右跨度增大,专业程度从下到上逐渐提高;金字塔形状显示出顶尖专家相对普通从业者的稀缺性;标题中的“攀登”“金字塔”帮助读者迅速理解图表含义;最后,设计者没有做过多修饰——没有真的用三维立体、沙石色的图形。

很多时候,概念描述的视觉化效果没这么好,你会得到下面这样的图表:

这张图中的颜色分层、阴影和3D效果反而妨碍我们理解概念;箭头并没有展现金字塔搜索方法;顶尖专家和普通从业者处在同一水平线,未能传达出重要性的差别。

2创意挖掘视觉化的4种类型

管理者可能不会想到,视觉化也可以用于创意挖掘;但在头脑风暴中,视觉化方法其实无处不在——白板、牛皮纸,以及传说中的餐巾纸背面。和概念描述一样,创意挖掘也使用符号,但更多是在非正式场合,如外出团建、战略讨论和创新项目早期阶段等。它的目标是从不同视角观察企业运作,解答复杂的管理难题,如架构调整、设计新业务流程、构建决策体系等。

创意挖掘可以一个人进行,但协作的效果更好。可以借鉴设计思维:先尽可能多地征集不同思路和视觉化方法,再择其一进行精细打磨。

乔恩·科尔科(Jon Kolko)是奥斯丁设计学院(Austin Center for Design)创始人兼院长,著有《同理心设计原理》(Well-Designed: How to Use Empathy to Create Products People Love)。他在办公室的白板墙上涂满观念化、探索性的图形。“思考复杂问题时,我们总会回到这个方法,”他说,“通过涂涂画画,我们能够穿越混乱,到达明晰。”擅长领导团队、发起头脑风暴、鼓励创新思考并捕捉创意的管理者,在这个象限中会干得不错。设计技巧和提炼能力在这里不那么重要,甚至可能适得其反:在寻求突破时,最不需要的就是归纳总结,而应尽可能快速发散;精细的设计同样会拖慢速度。

假设一个营销团队正在讨论如何向管理层展示进入高端市场的战略。一小时后,白板上有了几个想法。团队最终认可了其中一个,认为最能传达他们的理念——顾客数量减少,但人均消费大增。白板是这样的:

当然,创意挖掘过程中产生的图表,通常经过更严谨的设计,用于在正式场合传达理念。

3视觉探索视觉化的4种类型

这个象限可能最为复杂,因为它包含两类视觉化。上文将探索分为两类,一是假设检验,一是从数据中寻找规律、趋势和异常。前者的目标很明确,后者则相对发散。数据体量越大、复杂度越高、未知因素越多,探索工作的开放性就越高。
视觉探索1:求证。在这类探索活动中,你要回答下面两个问题中的一个:我设想的情况是否属实?如何用不同方式传达这一信息?

在进行求证时,数据范围相对可控,所使用图表类型较为常规;当然,若想以新颖方式呈现信息,也可尝试较少见的图表。求证型图表一般不用于正式场合;你要先自己找到正式展示所需的图表。因此,你的时间不应花在设计上,而应快速尝试不同模板,找到最好的数据视觉化方案;电子表格技巧、编程或网站搭建等快速开发原形的知识可能有帮助。

假设一位营销经理认为,在一天中的某些时段,消费者在线购买移动设备多于台式设备,但现有营销策略未能利用这一点。为验证自己的观点,他将一些数据输入到在线软件Datawrapper中。

他还无法证实或推翻假设,也没有发现其他规律,但他利用工具寻找不同视觉表达。他无需考虑设计问题,速度很快。如下图所示,他将柱状图变为线状图。
现在他发现了一些规律,但使用三个变量还难以把握两类产品销量的关系,于是他将变量减为两个(如下图)。每次尝试,他都会评估初始假设的有效性——在一天中的某些时段,消费者购买移动设备多于台式设备。
第四次尝试中,他缩短了时间周期,证实了假设(如下图)。
新的软件工具使这类视觉化比以前容易很多,让我们都变成数据分析师。

视觉探索2:开放性探索。更多时候,针对数据的开放性探索是数据科学家和商业智能分析师的领地,不过新出现的工具让一般管理者也可以参与进来。开放性探索很值得尝试,因为它经常带来独一无二的洞见。

由于缺少明确目标,开放探索型图表包含的数据范围较广,个别情况下可能会容纳多组数据,或建立自动更新数据的动态系统,也可用于统计建模。

管理者可通过调整参数、引入新数据源、迭代更新图表,进行交互性探索。复杂数据有时也可用于专业性、不常见的图表,如力导向图(用于表示网络结构)和地形图等。

此处,图表的功能重于形式:数据分析、编程、数据管理和商业智能比图表的观赏性更重要。在这一象限,管理者自然最需要请外部专家搭建数据处理系统,并根据分析目标制作图表。

安默尔·加格(Anmol Garg)是特斯拉的一名数据科学家,他利用视觉探索分析特斯拉电动车的海量传感器数据。他设计了一种交互式图表,用于显示在特定时间内的轮胎压力变化情况。加格和团队严格按照探索形式设计出图表,发现其用处很多:了解车辆出厂时轮胎充气情况、用户充气频率、用户对气压不足警报的反应时间;分析轮胎漏气率;建立模型预测轮胎漏气时点。散点图显示出四个轮胎的压力情况,一般人或许不明所以,专家则一目了然。

在探索数据的过程中,加格发现一些信息只能用图表传达。“我们时刻都在和海量数据打交道,”他说,“对照电子表格搜索数据库肯定一无所获,必须使用图表。”向管理层演示时,加格将探索型图表转化为较简单的图表(下文将介绍)。“他们最喜欢看图。”他说。

4日常数据视觉化视觉化的4种类型

大部分视觉探索工作由数据科学家承担,而管理者最常做的是日常数据视觉化。这一象限主要涉及常用图表,一般可在展示中直接使用。这些简单图表包括 线状图、柱状图、饼状图和 散点图等。

这里的关键词是“简洁”。一幅图表应该用有限几个变量,清晰传达一个信息。目标很明确:为听众确认并介绍背景信息。要做到简洁,设计十分关键。此类图表常用于正式展示,对清晰度和逻辑性要求很高。正式展示通常时间有限,如果图表设计不理想,介绍人就必须停下来解释,而图表中的信息本应一目了然。如果日常数据图表还需要额外说明,那它就是失败的,如同笑点需要解释的笑话。

这并不是说陈述性图表不应引发讨论,但讨论应针对图表传达的理念,而非图表本身。

假设一位人力资源副总裁要向高管层介绍公司的医疗开支情况。她想表达的是,医疗开支增速明显放缓,因此公司有机会投资多种医疗服务。

她在网上读到一篇相关报告,其中引用了一些官方数据,于是,把数据下载下来,用Excel做成线状图,几秒钟就完成了。但由于要做展示,她请公司一位设计师加入一些数据细节,让图表更完整。

这幅图表设计得不错,数据翔实,但可能并不合适。高管团队讨论公司福利支出,并不需要20年之久的历史数据。HR副总裁想说的是,近年医疗开支增速放缓,但图表能清晰传达出这一点吗?

一般来说,如果图表中的数据几秒钟内看不完,那么最好把这些信息打印出来或发到个人设备上,供需要获得信息但不想听报告的人员查阅。例如,医疗政策制定者参加听证会、讨论医疗支出长期趋势前,可以仔细研究这张图表。

HR副总裁需要一张更干净的图表。一条简单的折线其实就能清晰传达信息:

想达到这种简洁,需要原则和一些勇气。你会本能地想把所有已知信息都放进去。拥挤的图表似乎能告诉别人,你做了很多工作:“看看这些数据,我费了多大劲!”但这不是那位HR副总裁的目标;她要做的是说服同事投资新项目。使用新图表,她不用说一个字,高管团队就能看明白趋势。这样,她就为后面提出具体建议做好了铺垫。

从某些方面看,“数据视觉化”这个词很不到位,它把好图表的创造过程简化为某种机械程序,让人想到用于创造的工具和方法,而不是创造本身,就好像把《白鲸》叫作“词语序列”,把《星空》称为“颜色分布”。

“数据视觉化”这个词还反映出,当下人们过度强调技术过程,却忽视了最终效果。视觉化只是一个过程,而图表的最终任务是传达某种真实,让人们去感知、看到以前看不到的东西——去改变想法,进而采取行动。

通过学习视觉化的基本语法规则,我们能更有效地传达信息。但为达到理想效果,我们对视觉化的理解须更全面,在操作时也要更有全局意识。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:342791次
    • 积分:4820
    • 等级:
    • 排名:第5956名
    • 原创:112篇
    • 转载:351篇
    • 译文:6篇
    • 评论:17条
    最新评论