目录
一、视觉感知
1.低级和高级视觉
视觉低级:与物体性质相关。
视觉高级:对物体的识别和分类
视觉感知是指客观事物通过人的视觉器官在人脑中形成的直接反映,人类只有通过“视觉感知”才能达到“视觉认知”。
2.格式塔原则
包括以下基本原则:接近原则 相似原则 闭合原则 连续原则
3.颜色理论
1.三基色原理:红绿蓝
2.色彩三要素:色相、明度和饱和度
二、数据准备
1.数据类型:
根据数据模型分为:浮点型、整数、字符
根据测量标度分为:类别型数据、有序型数据、区间型数据和比值型数据
数据类型 | 操作 | 集合操作 | 统计操作 |
类别型 | =、≠ | 互换元素位置 | 类别、模式、列联相关 |
有序型 | =、≠、>、< | 计算元素单调递增(减) | 中值、百分位数 |
区间型 | =、≠、>、<、+、− | 元素间线性加(减) | 平均值、标准方差、等级相关 、积差相关 |
比值型 | =、≠、>、<、+、−、×、÷ | 元素间相似度 | 变异系数 |
2. 数据采集与预处理
3.大数据存储与管理
目前的主要数据存储介质类型包括内存、磁盘、磁带等。
主要数据组织管理形式包括按行组织、按列组织、按键值组织和按关系组织。
主要数据组织管理层次包括按块级组织、文件级组织及数据库级组织等。
4.数据库
关系数据库 、文档存储 、列式存储、 键值存储、 图形数据库、 分布式数据库 、内存数据库
5.大数据计算框架
数据类型:静态数据和动态数据
计算框架:批处理、流式处理、交互式查询
具体技术:MapReduce,Spark
6.数据挖掘
分类分析。 聚类分析。 关联分析。
7.数据类型可以分为4大类:
类别型数据,有序型数据,区间型数据,比值型数据。 对大数据做可视化展示之前,一般经过以下三个阶段: (1)数据采集与预处理; (2)大数据存储与管理; (3)大数据分析/数据挖掘;
三、数据可视化基本框架
1. 数据可视化流程
2. 数据可视化流程中的核心要素包括三个方面。
(1)数据表示和变换。 (2)数据的可视化呈现。 (3)用户交互。
3.设计数据可视化时,我们应遵守以下可视化设计标准:
1.要有很强的表达力,能真实全面地反映数据的内容。 2.有效性强,一个有效的可视化是可以在短时间内把数据信息以用户容易理解的方式显示出来。 3.能简洁地传达信息,这样能在有限的画面里表达更多的数据,而且不容易让用户产生误解。 4.易用,用户交互的方式应该简单,明了。用户操作起来更方便。 5.有美感,视觉上的美感可以让用户更易于理解可视化要表达的内容,提高可视化的效率。
四、数据可视化基本原则
1.数据可视化基本原则
1 数据筛选。 2.数据到可视化的直观映射 3.视图选择与交互设计 4 .可视化的隐喻
2.、数据到可视化的直观映射
在数据到可视化元素映射时,设计者不仅要明确数据语义,还要了解用户的个性特征。
数据到可视化的映射还要求设计者使用正确的视觉通道去编码数据信息。对于类别型数据属性,务必使用分类型视觉通道;对于有序型数据属性,也需要使用定序的视觉通道进行编码。
3.视图选择与交互设计
优秀的可视化展示,首先使用人们认可并熟悉的视图设计方式。 简单的数据可以使用基本的可视化视图。复杂的数据需要使用或开发新的较为复杂的可视化视图。此外,好的可视化系统还应该提供一系列的交互手段,使用户可以按照自己想要的展示方式修改视图展示结果。 视图的交互包括视图的滚动与缩放、颜色映射的控制(提供调色盘让用户控制)、数据映射方式的控制(让用户可以用不同的数据映射方式来展示同一数据)、数据缩放工具(用户可以选择最终可视化的数据内容)、细节控制(用户可以隐藏或突出数据的细节部分)。
五、常见的可视化技术
1.可视化技术分支
科学可视化、信息可视化、可视分析学
2.常见的可视化技术:
时间序列可视化,比例数据可视化,关系数据可视化,文本数据可视化
六、数据可视化工具
1.常见的工具
(1)入门级工具( Excel)
(2)在线可视化工具(D3、Echarts、Tableau、大数据魔镜)
(3)类GUI可视化工具(PolyMaps、Crossfilter、Tangle)
(4)高级分析工具( Processing、NodeBox、R、Python、Weka和Gephi)