数据可视化过程中常见的错误类型

  数据可视化是一个沟通复杂信息的强大武器。通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。但如果数据可视化做的较弱,反而会带来负面效果。错误的表达会损害数据的传播,完全曲解他们。

  所以优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当然并非所有的图表制作者都精于此道。所以,数据可视化的第一印象是十分重要的,为了防止这种情况发生,下面将讲解8个数据可视化过程中常见的错误类型。

  1、数据过载问题

  可视化内容过于拥挤,数据过多,很多不必要的内容可能会让数据更加难以理解。例如,三维图表虽然看起来令人印象深刻,但它们往往会使数据的解释更加困难。

  超过5个数据内容的组件,确实能够展现出大量信息,但如果读者们无法区分哪些是有用的、哪些是无用的,展现再多的信息也是毫无价值。一些不必要的插图、文字等等也会使得数据可视化冗杂。对于数据可视化来说,大多数情况下,少即是多。

  2、访问轴数值设置不当

  在处理定量数据时,条形图或折线图是两种最佳的可视化方法。但是,很多数据分析爱好者都会出现一个与图表轴相关的错误:对于较大的Y轴值来说,如果初始值设定到大于零,那么很可能会截断某些条形值,影响数值的准确性。

  3、数值比例不清晰

  饼图是一种非常流行且受欢迎的数据表现形式,然而却一直饱受非议。

  原因在于,如果不在图表中加入图形文本,那么实际上很难区分饼状图每一段的大小(你能看出类别1数据78和类别2数据80的区别吗的差异吗?),所以,想要确保图表清晰明了,所有区域都要添加标签。另外,使用饼图时,还要注意类别数量,细分太多也可能导致无法区分每个区域。

  4、混乱的交叉线

  位于特定范围内的数据通常用于展示随时间的变化。因此,折线图是传达数据之间的变化或差异的有效方式。您可能已经开始注意到这里的趋势,但重要的是不要在图表中使用太多的线。在图表上有大量的交换线会很快变得混乱,因此我们建议不要使用超过4个系列。

  重要的是,用户不应一味专注于设计美学,却牺牲数据的呈现精确度。用户可以使用不同类型的可视化形式(例如地图、直方图或图表)来相互补充,从而提供更全面的新闻讲述和更多基于数据的新闻。尤其是在人们身处不确定的时期时,可靠的事实和信息至关重要。

  5、引人误会的色彩对比

  色彩是最具说服力的设计元素之一。即使是细微的色调变化也会引起强烈的情绪反应。在数据可视化中,强颜色对比度可能会让观众认为价值差距比实际情况更大。

  在没有附加背景的情况下,这张热力图的高对比度配色方案使其看起来好像红色区域比较暗区域代表更高的数值量级。

  例如,热力图用颜色描述值的大小。较高的值显示为橙色和红色,而较低的值显示为蓝色和绿色。值之间的差异可能很小,但颜色对比会产生热感和增强的差距感。

  尽管如此,数据可视化工具可能会故意犯下一些常见错误,制图人也可能会犯下一些错误。例如,这些内容可以用于服务政治议程或操纵某个故事情节,并且完全误导读者。

  6、2.3D图形使用不当

  3D图形在数据可视化方面带来了两个严重的问题。

  当一个3D图形部分阻挡了另一个图形时,就会发生遮挡。这是在自然世界中模拟空间的结果,在自然世界中,对象的X,Y和Z坐标不同。在数据可视化中,遮挡会遮盖重要数据并创建错误的层次结构,其中无遮挡的图形显得尤为重要。

  当3D图形通过缩短缩入图片平面或从图片平面伸出时,就会发生失真。在绘图中,节距使对象看起来好像它们占据了三维空间,但是在数据可视化中,它创建了更多错误的层次结构。前景图形看起来较大,背景图形较小,并且数据序列之间的关系被不必要地扭曲了。

  7、省略基线和截断量表

  数据变化有时很大,例如根据地理区域衡量收入水平或投票习惯时。为了使可视化效果更加生动或美观,设计人员可以选择操纵图形上的比例值。

  一个常见的示例是省略基线或在零以上的某个地方开始Y轴,以使数据差异更加明显。

  8、选择错误的可视化方法

  每种数据可视化方法都有其自己的用例。例如,饼图用于比较整体的不同部分。它们适用于预算明细和调查结果(同一个饼图),但并不是要在不同的数据集(不同的饼图)之间进行比较。

  饼形图可用于可视化三个竞争企业的收益,但条形图可使两个企业之间的差异(或相似性)更加明显。如果可视化旨在显示一段时间内的收入,则折线图将比条形图更好。

  饼图用于比较整体的各个部分。使用它们比较不同的数据集(例如不同公司的收入),不会给观看者带来什么洞察力

  我们要如何避免这些在数据可视化过程中容易犯的错误?

  不要忽略图轴

  忽略图形的基线是一个常见错误。折线图和条形图轴应从零开始;否则,该图形可能会引起混乱。

  尽管数据在统计上可能是准确的,但其描绘方式传达了对数字的不准确理解。该图发布后也没有引用数据源。

  避免偏见

  记者不应选择数据来讲述他们想讲的新闻。而是,用数据去驱动新闻。允许偏差影响数据可视化是一个危险的错误,数据偏差可能会影响正在传达的信息。例如,如果您要处理的数字在图表上显示出递增的曲线,那么新闻故事应该要符合这一趋势。

  选择合适的图表

  要使用适合您要报告的数据的图表。例如,饼图可以将数据显示为占总数的百分比;地图则可以最好地说明地理情况。折线图本来是更合适的选择。

  遵守常规

  可视化数据时,记者不应破坏公认的规范。例如,与浅色相比,读者通常希望深色能反映图表上的最高密度或最大值。如果颠覆性规范可能会误导读者。

  有些颜色与观众有着直接的精神联系。例如,红色可以表示危险,而绿色可以传达更多积极信息。

  也要注意符号使用,因为它们每个都有自己的意义。例如,不要在正面新闻上使用悲伤的表情表情符号。

  去除不必要的视觉元素

  记着在可视化中应避免添加不必要的元素。如果您的图形或图表元素无法帮助传达信息,那么它只会使混乱甚至误导。

  可视化工具可以准确有效地传达您正在讲述的新闻。必须花费必要的时间来收集数据,分析数据并确定其中的故事。可视化数字可以增强您的报告,并更全面地将信息传达给读者。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
简单性 Java看起来设计得很像C++,但是为了使语言小和容易熟悉,设计者们把C++语言许多可用的特征去掉了,这些特征是一般程序员很少使用的。例如,Java不支持goto语句,代之以提供break和continue语句以及异常处理。Java还剔除了C++的操作符过载(overload)和多继承特征,并且不使用主文件,免去了预处理程序。因为Java没有结构,数组和串都是对象,所以不需要指针。Java能够自动处理对象的引用和间接引用,实现自动的无用单元收集,使用户不必为存储管理问题烦恼,能更多的间和精力花在研发上。 面向对象 Java是一个面向对象的语言。对程序员来说,这意味着要注意其的数据和操纵数据的方法(method),而不是严格地用过程来思考。在一个面向对象的系统,类(class)是数据和操作数据的方法的集合。数据和方法一起描述对象(object)的状态和行为。每一对象是其状态和行为的封装。类是按一定体系和层次安排的,使得子类可以从超类继承行为。在这个类层次体系有一个根类,它是具有一般行为的类。Java程序是用类来组织的。 Java还包括一个类的扩展集合,分别组成各种程序包(Package),用户可以在自己的程序使用。例如,Java提供产生图形用户接口部件的类(java.awt包),这里awt是抽象窗口工具集(abstract windowing toolkit)的缩写,处理输入输出的类(java.io包)和支持网络功能的类(java.net包)。 分布性 Java设计成支持在网络上应用,它是分布式语言。Java既支持各种层次的网络连接,又以Socket类支持可靠的流(stream)网络连接,所以用户可以产生分布式的客户机和服务器。 网络变成软件应用的分布运载工具。Java程序只要编写一次,就可到处运行。 编译和解释性 Java编译程序生成字节码(byte-code),而不是通常的机器码。Java字节码提供对体系结构性的目标文件格式,代码设计成可有效地传送程序到多个平台。Java程序可以在任何实现了Java解释程序和运行系统(run-time system)的系统上运行。 在一个解释性的环境,程序开发的标准“链接”阶段大大消失了。如果说Java还有一个链接阶段,它只是把新类装进环境的过程,它是增量式的、轻量级的过程。因此,Java支持快速原型和容易试验,它将导致快速程序开发。这是一个与传统的、耗的“编译、链接和测试”形成鲜明对比的精巧的开发过程。 稳健性 Java原来是用作编写消费类家用电子产品软件的语言,所以它是被设计成写高可靠和稳健软件的。Java消除了某些编程错误,使得用它写可靠软件相当容易。 Java是一个强类型语言,它允许扩展编译检查潜在类型不匹配问题的功能。Java要求显式的方法声明,它不支持C风格的隐式声明。这些严格的要求保证编译程序能捕捉调用错误,这就导致更可靠的程序。 可靠性方面最重要的增强之一是Java的存储模型。Java不支持指针,它消除重写存储和讹误数据的可能性。类似地,Java自动的“无用单元收集”预防存储漏泄和其它有关动态存储分配和解除分配的有害错误。Java解释程序也执行许多运行的检查,诸如验证所有数组和串访问是否在界限之内。 异常处理是Java使得程序更稳健的另一个特征。异常是某种类似于错误的异常条件出现的信号。使用try/catch/finally语句,程序员可以找到出错的处理代码,这就简化了出错处理和恢复的任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值