课程:Basics of Data Visualization
讲师:汤颖副教授
讲师简介:汤颖,副教授,浙江工业大学计算机学院副教授。主要研究方向:1)计算机图形图像:面向网络的大规模三维场景实时绘制;2)虚拟现实:虚拟森林植被仿真技术;3)信息可视化:可视图形元素对抽象信息的表达。
课程简介:本次课程将概要地介绍数据可视化的基本流程和核心步骤,总结基本的可视化图表映射方法,并阐述数据可视化的基本设计理论。
接下来介绍本次课程的主要内容。
图1 本次课程内容概要
1. 可视化流程模型
- 概念模型
这个模型主要讲的是原始数据经过数据分析、过滤、映射和编码经由行数据转换为图形式的数据的过程。
图2 概念模型的流程
- 数据状态参考模型
该模型从数据的形式来描述可视化的过程,先从数值转变为抽象数据类型,然后进行可视化转换转变为抽象的可视化数据类型,最后经过可视化绘制转换转变为视图。
图3 数据状态参考模型的流程
- 可视化参考模型
该模型将流程变为回路,用户可以在可视化进行的任何阶段进行交互。
图4 可视化参考模型的流程
2. 可视化编码原则
- 数据类型
数据类型分为两类:①无序,如苹果、橘子、香蕉等分多个类型;②有序,有序又分为离散点的有序及连续点的有序两类,其中,例如数值的不断增大可称为连续点的有序,例如周一、周二...周日可称为离散点的有序。
数据模型与概念模型的比较:
数据模型:强调数学上的抽象,设有操作部分。例如,带+,-,*或/的整数或浮点数。
概念模型:是一种心理的构建,包括语义、数据等。例如,使用地标在整个城市中穿梭。
- 视觉编码
数据编码包含7种通道、3种标记。通道包括位置、尺寸、数值、质地、颜色、方向、形状等;标记包括点、线、面等。如图5所示。
图5 可视化的通道与标记
对于通道,有如图6所示的视觉编码有效性排名。
图6 通道的视觉编码有效性排名
在视觉编码中存在很多技巧,本次课程中提出了popout、grouping两种常用的技巧。
- 颜色
①小区域的颜色难以察觉,大区域的鲜艳颜色看起来更大。对于小区域应使用明亮,饱和的颜色,对于大区域和背景应使用低饱和度的柔和色彩。
②只有少量颜色可以有效地用作标称标签。保持标称数据的颜色数少于8。
③亮度和饱和度对于序数数据是有效的,因为它们具有隐含的感知排序。
④可以使用离散或连续的色彩图显示定量数据,使用离散色彩图可以提高准确性。
3. 可视分析模型
•嵌套模型
将数据可视化设计简化为4个层次:第一层是找到用户的问题;第二层为抽象层,将特定的数据映射到抽象且通用的数据类型;第三层为编码层,设计与数据类型相匹配的视觉编码和交互方法;第四层为算法层,用正确算法实现系统。如图7所示。
图7 嵌套模型
嵌套模型可以独立的分析每个层次的设计是否正确合理,但其也存在一些问题:上游的错误会级联到下游。在实际的可视化设计中,需要做多次测试来验证反馈系统的有效性。