数据可视化分为探索性分析和解释性分析
可视化简史
- 前计算机时代:图的诞生
- 计算机时代:借助计算机图形学的数据可视化(数据可视化呈现高维、交互、动态三大特征)
数据基础
数据类型
- 结构数据(表格数据)
- 非结构数据
- 树状:节点代表特征(决策树)
- 网络:节点代表观测,边代表关系(社交网络)
- 文本:词代表中文分词
- 时间:X轴为时间戳,Y轴为观测
- 空间:地理位置、网格
数据尺度
- 定性数据
- 定类
- 定序
- 定量数据
- 定距
- 定比
- 分类数据、等级数据、数值数据
- 多元数据、高维数据(数据维数不太大时,可以使用视觉编码直接可视化;数据维度较高时,需要通过算法进行降维处理)
视觉感知——格式塔视觉原理
两个基本假设:马赛克(捆绑)假设和关联假设
格式塔原理的六个基本原则
•
Principle 1: 相似性(Similarity Principle)
•
Principle 2: 接近性 /临近性(Proximity Principle)
•
Principle 3: 连续性 (Continuity Principle)
•
Principle 4: 闭合性 (Closure Principle)
•
Principle 5: 图形与背景关系法则 (Figure-Ground Articulation)
•
Principle 6: 简单性法则(Simplicity)
可视化之美
新颖、充实、高效、美感
可视化一定优先考虑信息传递的有效性,在此基础上增加美感