第2章 大数据可视化基础

目录

1  光与视觉特性

1.1 光的原理

1.2 光源——正在发光的物体 

1.3 可见光

1.4 人眼的构造

1.5 人眼的视觉特性

2  色彩

2.1 色彩的概念

2.2 色彩原理模型

2.3 色彩给人的视觉感受

3  视觉通道

3.1 可视化编码(视觉编码)

3.2 视觉通道的类型

3.3 常用的视觉通道

4  数据可视化流程

4.1 数据可视化流程简介

4.2 实施步骤

5  数据可视化设计原则与技巧

5.1 数据可视化设计原则

5.2 数据可视化设计技巧

案例分析——性别分布线性可视化过程 

6  数据可视化基本图表

7  数据可视化工具

7.1 分类


光与视觉特性

1.1 光的原理

光是一种肉眼可以看见的电磁波
是人认识外部世界的工具
是信息的理想载体或传播媒质

1.2 光源——正在发光的物体 

自然光源,如太阳光、水母 ……
人造光源,如电灯、激光 ……

1.3 可见光

可见光是电磁波谱中人眼可以感知的 部分
波长在 380 780nm 之间
正常人眼对于波长为 555nm (纳米)的黄绿色光最 敏感

 1.4 人眼的构造

角膜、晶状体、 玻璃体、视网膜、视神经等组成
角膜、晶状体、 玻璃体将光线聚焦到视网膜上
视网膜上的感光细胞:
Ø 视锥细胞: 分辨颜色 和细节
Ø 杆细胞:对光线极敏感

1.5 人眼的视觉特性

       (1)人眼的光谱灵敏度

范围: 380~780nm
对黄绿色最灵敏,对红光、蓝紫光都不灵敏
暗环境中,视锥细胞失去感光作用,仅能辨别白色和灰色

(2)人眼能感受的亮度范围

平均亮度适中时,能分辨的最大和最小亮度比为1000:1

平均亮度很低时,能分辨的最大和最小亮度比不到10:1

3)同时对比度

背景亮度不同,人眼所感受的主观亮度值也不一样

亮背景下显得暗、暗背景下显得

色彩

2.1 色彩的概念

色彩是色彩是通过眼、脑 和生活经验产生 的一种对光的视觉 效应

2.2 色彩原理模型

RYB模型:

Ø 三原色:红色、黄色、蓝色
Ø 间色:橙色、绿色、紫色
Ø 复色:间色 + 间色、原色 + 间色
Ø 用于艺术和应用设计

RGB模型:

Ø 红( Red )、绿( Green )、蓝( Blue
Ø 光线本身所带的 色彩
Ø 所有 颜色混合在一起就变成白色, 完全没有 颜色的状态就变成 黑色
Ø 用于计算机

CMYK模型:

Ø 青( Cyan )、品红( Mangenta )、黄( Yellow )、黑( Black
Ø 用于印刷工业

2.3 色彩给人的视觉感受

1)色彩的冷暖感

视觉色彩引起人们对冷暖感觉的心理联想
暖色:红、橙、黄
冷色:绿、蓝、紫
性色:黑、白、灰

2)色彩的轻重感

色彩的轻重感主要与色彩的明度 有关
明度指色彩的明亮程度
•色彩的明度主要取决于颜色本身对自然光的反射率
人类视觉识读色彩遵循从明到暗的扫描过程

3)色彩的前后感

根据人们对色彩距离的感受而划分的 类型
一般 可分为前进色和后 退色
前进色 :向上凸出的 颜色,包括红、橙、黄等暖色,高 彩度的 颜色
后退色 :向下凹陷的 颜色,包括紫、蓝、 深绿等冷色 ,低 彩度的 颜色

视觉通道

3.1 可视化编码(视觉编码)

数据可视化的核心内容,将数据信息映射成可视化元素的技术
由两部分组成:
Ø 几何标记:指可视化中常见的一些几何图形元素,如点、线、面、体
Ø 视觉通道 :控制 几何标记的展示特性,包括标记的位置、大小、 长度等

3.2 视觉通道的类型

1)用于定性分类性质的视觉通道

2)用于定量或定序性质的视觉通道

3.3 常用的视觉通道

1)平面位置

编码 定序或定量
编码分类

2)颜色

可以编码大量数据信息的视觉 通道
分为 亮度、 饱和度、色调三 个视觉 通道
Ø 亮度 适合于编码有序数据 。但需要注意的是亮度通道可辨性小,一般尽量使用少于 6 个不同层次的可辨亮度层次
Ø 饱和度 :指色彩 的纯正程度,越纯正饱和度越高。如纯蓝、纯红、纯绿属于高饱和度,而灰蓝、玫红、草绿属于低饱和度。图片的饱和度越高说明图片色彩越鲜艳,否则越 灰暗。同样 适用于有序数据编码
Ø 色调:色调 适用于编码分类的数据属性 ,可以 增加许多视觉效果,被广泛使用。

3)尺寸

定量或定序的视觉通道

4方向

        方向可用于分类或有序的数据属性的编码,斜度即方向或角度。它还可以用于编码数据的发散性

5)图案

图案称为纹理,是 多种视觉变量的组合,包括形状、颜色和 方向
可用 于分类分组 数据

6)形状

对象的轮廓,或者对事物外形的抽象
用于定性描述

数据可视化流程

4.1 数据可视化流程简介

数据可视化是一个系统的流程,该流程以数据为基础,以数据流为导向,还包括了数据采集、数据处理、可视化映射和用户感知等环节。

 4.2 实施步骤

1 数据采集

数据 可视化的基础是数据,数据可以通过仪器采样、调查记录等方式进行 采集
对显示世界的信息进行采样,以便产生可供计算机处理的数据
形式分为主动和被动两种
Ø 主动采集以明确的数据需求为目的,利用相应的设备和技术手段主动采集所需要的数据,如卫星成像、监控数据等
Ø 被动采集以数据平台为基础,由数据平台的运营者提供数据来源,如通过网络爬虫技术进行抓取

2 数据处理和变换

是数据的前期处理
数据清洗、提取特征

3 可视化映射

可视化流程的核心
原始数据 :加载到的页面上的原始数组
统计分析 :统计函数加工数据
预处理数据 :每个视图接收到的数据
过滤 :行过滤、列过滤
关注数据 :当前图表关注的数据
映射 :将数据从数值域转换为几何属性
几何数据 :将几何属性转换成不同的几何元素
绘制 :调用绘图库,绘制出图形
图形数据 :最终形成图表

4 用户感知

数据可视化结果中提取信息、知识和灵感

数据可视化设计原则与技巧

5.1 数据可视化设计原则

1 可信原则

        正确的表达数据中的信息而不产生偏差和歧义

2)清晰表达信息原则

相近( Proximity ):距离相近的各部分趋于组成 整体
相似 Similarity ):在某一方面相似的各部分趋于组成整体
连续( Continuity 人们 倾向 于完整地连接一个图形,而不是观察残缺的线条或 形状

3)美学原则

设计能够让人赏心悦目的可视化

5.2 数据可视化设计技巧

1)建立视觉层次,用醒目的颜色突出数据,淡化其他元素

2)高亮显示重点内容

3)提升不同区域的色阶跨度

4借助场景来表现数据指标

5将抽象的不易理解的数字转换为容易被人感知的图表

6)尽量让图表简洁

案例分析——性别分布线性可视化过程 

数据可视化基本图表

柱状图        折线图        直方图        饼图        等值线图        走势图        散点图        气泡图        维恩图        热力图        雷达图        盒须图        多视

数据可视化工具

7.1 分类

商业软件,如 Tableau DataV FineBI Excel
编程语言,如 R Python
开源包, ECharts

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值