文章目录
什么是可视化
可视化的概念[参考]
- 利用计算机图形学和图像处理技术,
- 将数据转换成图形或图像在屏幕上显示出来,
- 再进行交互处理的理论、方法和技术。
可视化的类型:
- 科学可视化 (Scientific Visualization):
科学学科基于研究需要要将数据可视化。 主要关注有天然几何结构(如磁感线、流体分布等)的、三维的科学信息的可视化。是计算机图形学的一个子集。目的是使科学家能够从数据中了解、说明和收集规律。 - 信息可视化 Information Visualization()
常用于统计学,常用二维空间。怎么直观展示大量抽象信息。包括柱状图、趋势图、流程图、树状图等。 - 可视分析学 (Visual Analytics):
包含人机交互,实现人机互补。通过交互式视觉界面进行分析推理。将交互式视觉表示与基础分析过程(统计过程、数据挖掘技术)结合,能有效执行高级别、复杂的活动(推理、决策)。
可视化的形式
参考本文
数据视频、数据漫画、仪表盘(dashboard)、图表动画、图表标注等。
七种常用的可视化叙事方式:
- 蛇形图(Snakes)
数据可视化基础理论
可视化流程
数据模型
数据一般被分为四类:类别型、有序型、(区间型、比值型)。
区间型和比值型,统称为数值型。
视觉编码
视觉编码(visual encoding)是将数据映射到最终可视化结果上的过程。
我们通常把这种图形符号<——>信息<——>视觉系统的对应称作视觉通道。(形状、颜色、尺寸、透明度等,叫视觉通道)
需要考虑数据类型,色彩搭配,交互性等各方面来设计。
交互式可视化
交互式可视化可以通过缩放等方法进行细节概述。它有如下的步骤[3]:
1、选择:交互式根据用户的兴趣选择数据实体或完整的数据集,以及它的子集。
2、链接:在多个视图找到有用的信息,如图3所示。
3、过滤:帮助用户调节显示的信息量,减少信息数量并且专注于用户感兴趣的信息。
重排或再映射:空间布局是最重要的视觉映射,重排信息的空间布局对产生不同的见解非常有效。
可视化技术
可视化技术栈[参考]
具备专业素养的数据可视化工程师一般来说需要掌握以下技术栈:
- 基础数学:三角函数、线性代数、几何算法
- 图形相关:canvas、svg、webgl、计算图形学、图论
- 工程算法:基础算法、统计算法、常用的布局算法
- 数据分析:数据清洗、统计学、数据建模
- 设计美学:设计原则、美学评判、颜色、交互、认知
- 可视化基础:可视化编码、可视分析、图形交互
- 可视化解决方案:图表的正确使用、常见的业务的可视化场景
相关Web技术[参考]
- html + css (传统方式)
- svg:矢量图
- canvas:可自由绘制的画布
- webGL:高性能,显卡加速的3D绘图协议
数据可视化概览 列举了一些Web技术。
智能可视化技术
智能可视化系列文章
最主要是讲了自动生成图表、动画等数据故事的一些论文,主要方法包括基于算法设计、强化学习、机器学习(随机森林)等。
- Vega-Lite:一套方便的交互可视化语法
- VizML-基于机器学习的可视化推荐方法:在给定数据集后自动挑选可视化形式(柱状图、折线图、散点图等),并且自动决定在x轴和y轴上分别放置什么数据。VizML在两种情况下(两种可视化类型和三种可视化类型)均比其它模型要更优(DeepEye和Data2Viz),在三种可视化类型的情况下甚至比人类的选择要更好一些。
- VizNet:可视化领域的大型标准数据集
- DataShot与Calliope:可视化故事自动生成方法
- Text-to-Viz自然语言生成信息图方法
- 时间线信息图的自动化模板提取
- Draco-基于知识约束的可视化图表智能设计系统: 输入数据和规则,输出可视化设计或评估现有设计是否符合规则 (2018 InfoVis best paper)
- 可视化的自动化与智能推荐 (VIS2020): 一些自动生成、适配、上色、转场语法推荐等
- 可视化动画的自动生成(EuroVis2021):基于优化、机器学习、强化学习等
可视化设计
简化数据+设计美学+故事思维=可视化
用数据讲故事 七种不同的数据展示方法分析
可视化叙事