读了一本有趣的电子书《趣味数据分析》,里面提到了一个名词——数据墨水比,来学习一下。
定义
数据墨水比是爱德华·塔夫特(Edward Tufte)引入的一个概念,他是一位专家,他的工作对设计有效的数据呈现做出了重大贡献。在他1983年出版的《定量数据的视觉显示》(The Visual Display of Quantitative Data)一书中,他阐述了这一目标:
-
最重要的是显示数据——塔夫特, 1983
-
图形上的大部分墨水应该呈现数据信息,墨水随着数据的变化而变化。数据信息是图形的不可擦除的核心,非冗余的墨水根据所代表的数字的变化而排列。——塔夫特, 1983
爱德华·塔夫特将数据墨水称为用于呈现数据的不可擦除的墨水。如果数据墨水从图像中被移除,图形将失去内容。因此,非数据墨水是指不传输信息的墨水,但它被用于标度、标签和边缘。数据-墨水比例是指与整个显示屏中使用的油墨(或像素)总量相比,用于呈现实际数据的油墨比例。(数据墨水与非数据墨水的比例)。
好的图形应该只包括数据墨水。在可能的情况下,非数据墨水应被删除。这样做的原因是为了避免将数据展示的观看者的注意力吸引到不相关的元素上。
我们的目标是设计一个具有尽可能高的数据-墨水比率的显示器(也就是尽可能接近1.0的总和),而不消除一些对有效交流来说是必要的东西。
优化对比
案例1
如果图形具有过多的噪声和分散注意力的元素,则认为它的数据墨水比较低。下面是一个示例,其中背景,网格线,3D效果,阴影和其他不必要的美学分散了所表示的数据。
所有分散注意力的元素都被删除后,最大程度地关注数据本身:
可以看出,消除干扰后可视化更容易理解,并且能够更多地关注数据。
案例2
科学数据可视化与商业数据可视化,至少有一点是一样的,它们都专注于传递观点。
- 快看不见数据在哪里了,如果你的打印机不好可能打印不出来这张图
改进之后的效果,可以是这样子的:
总结
数据需要成为最重要的因素,如果向图表中添加更多不会提高数据的关注度的内容,则不应该添加它。
查看你的图表,看看是否可以删除任何内容。是否存在与数据竞争的网格线?是否可以删除它们?或者使它们更淡一些?你可能会惊讶地发现,在没有网格线的情况下仍然可以理解(甚至更容易理解)图表。
最终,这一切都是为了取得平衡,将图表和图形简化到清晰易懂的程度。
参考链接:
- https://infovis-wiki.net/wiki/Data-Ink_Ratio
- https://zhuanlan.zhihu.com/p/137943119
- https://speedwell.com.au/en/insights/2019/the-manifesto-of-the-data-ink-ratio