1. 数据可视化简介 笔记

以上是引用了某本书籍的目录 数据可视化-百度百科

参考:大数据分析与应用_可视化基础PPT

1 可视化释义

定义
可视化对应两个英文单词:VisualizeVisualizationVisualize即生成符合人类感知的图像,通过可视元素传递信息;Visualization即使某物、某事可见的动作或事实,对某个原本不可见的事物在任的大脑中形成可感知的心理图片的过程或者能力。
在计算机学科的分类中,利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化[唐泽圣2011]
在百度百科中,可视化(Visualization)是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,再进行交互处理的理论、方法和技术。


功能
从宏观角度来看,可视化包括三个功能:信息记录,信息推理与分析,信息传播与协同。

简而言之就是:记录理解传播

信息记录:如可视化图绘
在这里插入图片描述

1616年伽利略关于月亮周期的绘图

信息推理与分析:将信息以可视的方式呈现给用户,引导用户从可视化结果分析和推理出有效信息,可以极大的降低数据理解的复杂度;同时可以通过扩充人脑记忆来显著提高分析信息的效率(如图形化计算)
在这里插入图片描述

对奇数和的可视化

在这里插入图片描述

斯诺绘制的霍乱“鬼图”,图符清晰显示了霍乱(“·”)集中在布拉德街的水井(“×”)附近

信息传播与协同:面向用户,传播与发布复杂信息的最有效途径是是将数据可视化,达到信息共享与论证、信息写作与修正、重要信息过滤等目的。
例如挑战者号的惨剧缘由。(参考:其他人的可视化学习笔记)
生产商提交NASA的图表上,工程师只列出了橡胶圈爆裂的情形,虽然简单明了但没有说服力。而之后的Edward Tufte教授绘制的可视化图标就清晰展现了低温与密封圈成功的关系。

这里推荐Edward Tufte教授的图形原则 ,那几本书也是值得一看的。
原文链接:http://www.jianshu.com/p/38910de20e13

而对于处理某些复杂的科学问题上,会发现人类直觉胜于机器智能。比如美国华盛顿大学可视化专家和蛋白质结构学家共同开发的一款游戏"Fold.It"。该游戏结果表明玩家预测出正确的蛋白质结构的速度比任何算法都快。(百度百科:Fold.It


2 可视化简史

参考链接:一篇文章读懂数据可视化简史

时间概述
17世纪之前图表萌芽
1600-1699年物理测量
1700-1799年图形符号
1800-1900年数据图形
1900-1949年现代启蒙
1950-1974年多维信息的可视编码 (书:Semiology of Graphics)
1975-1987年多维统计图形(如1981的鱼眼方法)
1987-2004交互可视化(可视化有助于统一计算机图形学、图像处理、计算机视觉、计算机辅助设计、信号处理和人机界面中的相关问题)
2004年至今可视分析学(数据海量、高维、多源、动态)

相关信息 :重要会议和组织:
电气和电子工程师协会(IEEE,全称是Institute of Electrical and Electronics Engineers)是一个美国的电子技术与信息科学工程师的协会,是目前世界上最大的非营利性专业技术学会。
IEEE Visualization ConferenceIEEE科学可视化会议
IEEE Conference on Information Visualization1995年开始的单独面向信息可视化的会议,它以研讨会的形式附属于IEEE Visualization会议
IEEE Visualization最顶级的可视化学术年会,信息可视化会议
IEEE Conference on Visual Analytics Science and TechnologyIEEE视觉分析科学与技术会议
EuroVis欧洲可视化年会

3 数据可视化详解

  • 层次模型
    在信息管理、信息系统和只是管理学科中,最基本的模型是“数据、信息、知识、智慧(Data、Information、Knowledge、Wisdom,DIKW)”层次模型[Rowley2007]

在这里插入图片描述
它以数据为基层结构,通过信息流顺序完成数据到智慧的转换。这种模型也作为一种数据处理流程,完成从原始数据的转化。
在这里解释一下各个名词:
数据:关于现实世界中的时间、地点、事件、其他对象或概念的描述。而不同学者大概给出了以下几类定义:

  • 数据即事实,数据是对未组织处理的离散的、客观的观察
  • 数据即新号,数据是基于感知的信号刺激或信号输入,如是视觉、听觉、嗅觉等。
  • 数据即符号,数据可定义为表达感官刺激或感知符号的集合,即对象、事件或所处环境的属性

信息:被赋予了意义和目标的数据。有两类特性:

  • 结构性和功能性:信息是组织好的结构化数据,从这个意义上说,信息和数据最大的差别在于结构而不是功能。
  • 象征性和主体性:信息是通用的、以符号和信号形式存在的数据。另外的观点则认为,信息具有主体性,符合所依附的对象。

知识:是被处理过、组织过、应用或付诸行动的信息。也是框架化的经验、价值、情景信息、专家观察和基本直觉的流动集合,它提供了环境和框架,用于评估和融入新的经验和信息。
智慧:智慧和信息的区别等价于为什么做和为什么是。


  • 可视化误区

数据可视化经常陷入两个误区:为了实现其获取知识的功能而令人感到枯燥乏味;或者为了画面美观而采用复杂的图像。提示了我们,数据可视化的要达到真实性(是否正确地反映出数据的本质),倾向性(可视化所表达的意象对于社会和生活具有什么意义和影响),美观性(形式和内容是否和谐统一)。


  • 分支

数据可视化包含处理科学数据的科学可视化与处理抽象、非结构化信息的信息可视化两个分支。
科学可视化分为:向量场可视化、标量场可视化、张量场可视化;
信息可视化要根据特定数据分析的需求决定数据元素在空间的布局,所以方法与针对的数据类型密切相关,所以分为:时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化、多变量数据可视化。
具体研究方向


  • 可视分析学

综合了图形学、数据挖掘和人机交互技术的一门分析推理学。(略,自己搜索相关资料啦)


  • 关联领域(简单指出)

图形学、人机交互;
数据库与数据仓库;
数据分析与数据挖掘;(1.探索性数据分析 2.模型选定分析 3.推断分析 可视化更擅于探索性数据分析
面向领域的可视化;
信息视觉设计;(图绘学)


4 数据可视化研究挑战

数据可视化研究实质仍然是两个方面:理解可视化如何传递到观者开发能有效地创造可视化的原理与技术
目前分析可视化系统时,设计者至少考虑三个不同方面的约束:

  • 1 计算能力的可扩展性
  • 2 感知和认知能力的局限性
  • 3 显示能力的局限性

围绕特性,挑战主要为:

  • 1 大数据可视化
  • 2 以人为中心的探索式可视化分析

其他东西自己搜索下吧,相关知识什么的。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python数据分析与可视化是数据科学领域中常用的工具之一。它提供了丰富的库和方法,用于处理和分析各种类型的数据,并通过图表和可视化展示数据结果。 在进行数据分析时,Python提供了Pandas和NumPy等强大的库,用于处理和清洗数据。Pandas提供了DataFrame和Series等数据结构,可以方便地操作和查询数据。NumPy提供了各种数学函数和矩阵等工具,可以进行高效的数值计算。 在数据分析的基础上,Python还提供了诸如Matplotlib、Seaborn和Plotly等库,用于数据可视化。这些库提供了丰富的图表类型,可以用于展示和传达数据的信息。Matplotlib是Python最常用的绘图库之一,提供了各种绘图函数和方法,使用户可以自定义图表的样式和排版。Seaborn是基于Matplotlib的高级绘图库,专注于统计可视化,提供了丰富的统计图表类型和配色方案。Plotly是一种交互式绘图库,可以生成高质量的图表,并支持与用户的交互。 通过Python数据分析与可视化,用户可以从数据中提取有价值的信息。比如,可以进行数据聚合和汇总,计算统计指标,发现数据的规律和趋势。同时,数据可视化也可以帮助用户更直观地理解和解释数据,从而更好地支持决策和沟通。 总之,Python数据分析与可视化提供了强大的工具和方法,用于对各种类型的数据进行处理、分析和可视化。它能够帮助用户更深入地理解数据,从中发现价值,并将结果以直观的形式展示出来。无论是在学术研究、商业分析还是日常工作中,Python数据分析与可视化都是一种有力的工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值