编码 vs 解码(Encode vs Decode)

数据可视化文章翻译

可视化技术将数据编码成为肉眼可见的图形和颜色,我们总是认为所有看这些图片的用户都能够理解图中的数据和信息。但事情并没有这么简单。

编码

在绘制条形图时,计算机程序会通过实际的数值来计算条的长度。在绘制饼图时,程序会通过数值来计算角度。在绘制散点图时,程序会根据每个数据点的值,来将点绘制在坐标系中,并最终组成一张散点图。

我们对于编码可视化图形的部分了解得十分透彻。我们清楚地知道每一张可视化图片都是怎么来的,这个过程一点也不神秘,只不过是机械的过程罢了。

我们同时也有非常多的关于可视化的理论,比如,Bertin 的视网膜变量,尽管这个理论的名字与视网膜有关,它本质上还是关于编码的理论。再比如,Wilkinson 的图像语法,它是有关如何用不同的方式来编码数值的形式方法。

数据的属性,比如一个数据的取值是数值还是标量,0 是否有意义等等,都是有关于编码的。所有的这些属性都存在于机器之中,我们可以非常轻易地形式化描述这些属性。

解码

但说到解码,事情就变得更加混乱了。我们是如何解码的?我们总是喜欢假设解码就是编码的逆向:我们可以从可视化图中读取数值。但是我们不仅仅做不到这件事,我们对其他很多问题的理解也可以称得上令人讶异的匮乏。

当看到一张条形图,我们很少盯着单独某一条看,一般都在互相比较。我们也会看这个图表整体呈现出的的形状。这就是为什么给一张图表中的数据排序是极其重要的。

当我们看到一张饼图,我们可能会把每一块和整体进行比较。除此之外,我们当然还会把每一块与其他块进行比较。这些和角度有什么关系吗?我们很明显不是通过看每一块的角度来阅读一张饼图的。

当我们在看散点图、平行坐标图等类似的更复杂的图表时,事情就更加有意思了。当看散点图时,没有人根据坐标轴去比较两个点的差异,我们会去看这张图整体的形状。通过看整体的形状,我们能获得数据是否相关的概念(我们非常善于估计),聚类和密度,还有异常点。这些比盯着数值看有意思多了。

可视化的意义如果可视化技术是关于如何解码数值的,那么长宽比这种事情就不再重要了,条形图中你想要比较的两个条之间有多少个条也不重要,饼图中,每一块的方向也不再重要了。如果可视化技术是关于解码数值的,那么我们不用再去费心思设计什么可视化图形,我们不会从散点图中了解数据的相关性、聚类或者异常点了。把数据画成图像也没什么意义了。让可视化技术如此有用的,是我们的能力远远不止于从图表中解码数值。那也事情变得有趣,也让事情变得复杂。迄今为止,我们一直将我们大部分的精力放在可视化技术的编码层面。然而,我们需要去了解更多解码层面的复杂性和作用。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值