【数据可视化】数据可视化分类

    数据可视化分为:科学可视化、信息可视化,可视化分析学这三个主要分支。
    科学可视化,处理科学数据,面向科学和工程领域的科学可视化,研究带有空间坐标和几何信息的三维空间测量数据、计算模拟数据和医疗影像数据等,重点探索如何有效地呈现数据中几何、拓扑和形状特征。 信息可视化,处理对象是非结构化、非几何的抽象数据,如金融交易、社交网络和文本数据,其核心挑战是如何针对大尺度高维数据减少视觉混淆对有用信息的干扰。 可视分析学,由于数据分析的重要性,将可视化与分析结合,形成的新的学科。

科学可视化(Science Visualization)

    面向的领域主要是自然科学,如物理、化学、气象气候、航空航天、医学、生物学等各个学科,这些学科需要对数据和模型进行解释、操作与处理,旨在寻找其中的模式、特点、关系以及异常情况。
    标量场可视化。标量指单个数值,即在每个记录的数据点上有一个单一的值,标量场指二维、三维或四维空间中每个采样处都有一个标量值的数据场。可视化数据场f(x,y,z)的标准做法有三种:1、将数值直接映为颜色或透明度,如用颜色表达地球表面的温度分布;2、根据需要抽取并连接满足f(x,y,z)=c的点集,并连接为线或面,称为等值线或等值面方法,如地图中的等高线,标准的算法有移动四边形或移动立方体;3、将三维标量数据场看成能产生。传输和吸收光的媒介,光源透过数据场后形成半透明影像,称为直接体绘制方法,这种方法可以以透明层叠的方式显示内部结构,为观察三维数据场全貌提供了极好的交互浏览工具。

    向量场可视化,向量场在每个采样点处都是一个向量(一维数据组)。向量代表某个方向或趋势,例如风向等。向量场可视化主要关注点是其中蕴含的流体模式和关键特征区域。在实际应用中,由于二维或三维流场是最常见的向量场,所以流场可视化是向量场可视化中最重要的组成部分。除了通过拓扑或几何方法计算向量场的特征点、特征线或特征区域外,对向量场直接进行可视化的方法包括三类。
1、粒子对流法,其关键思想是模拟粒子在向量场中以某种方式流动,获得的几何轨迹可以反映向量场的流体模式。这类方法包括流线、流面、流体、迹线和脉线等。
2、将向量场转换为一帧或多帧的纹理图像,为观察者提供直观的影像展示。标准的做法有随机噪声纹理、线积分卷积(LIC)等。
3、采用简化易懂的图标编码单个或简化后的向量信息,可提供详细信息的查询与计算,标准做法有线条、箭头和方向标志符等。

    张量场,可视化方法分为基于纹理、几何和拓扑三类。基于纹理的方法,将张量场转换为静态图像或动态图像序列,图释张量场的全局属性,其思想是将张量场简化为向量场进而采用线性积分法、噪声纹理法等方法显示。基于几何的方法显示地生成刻画某类张量场的属性的几何表达,其中,图标法采用某种几何形式表达单个张量,如椭球和超二次曲面;超流线法将张量转换为向量,再沿主特征方向进行积分,形成流线、流面或流体。基于拓扑的方法计算张量场的拓扑特征(如关键点、奇点、灭点、分叉点和退化线等),依次将感兴趣区域部分分为具有相同属性的子区域,并建立对应的图结构,实现拓扑简化、拓扑跟踪和拓扑显示,基于拓扑的方法可以有效地生成多变量场的定性结构,快速构造全局流场结构,特别适合于数值模拟或实验模拟生成的大尺度数据。

信息可视化(information Visualization)

信息可视化处理的对象是抽象的、非结构化数据集(如文本、图表、层次结构、地图、软件、复杂系统等)。与科学可视化相比,信息可视化更关注抽象高维数据。此类数据通常不具有空间中位置的属性,因此要根据特定数据分析的需求,决定数据元素在空间的布局。因为信息可视化的方法与所针对的数据类型紧密相关,所以通常按数据类型分为如下几类:
1、时空数据可视分析
2、层次与网络结构数据可视化
3、文本和跨媒体数据可视化
4、多变量数据可视化

可视分析学(Visual Analytics

    可视分析学,被定义为一门以可视交互界面为基础的分析推理科学。综合了图形学数据挖掘人机交互等技术,以可视交互界面为通道,将人的感知和认知能力以可视的方式融入数据处理过程,形成人脑智能和机器智能优势互补和相互提升,建立螺旋式信息交流与知识提炼途径,完成有效的分析推理和决策。
包含数据分析、交互、可视化。


注:摘自《数据可视化》

  • 6
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
鸢尾花数据集是一个经典的分类问题数据集,包含了三个不同品种的鸢尾花的花萼长度、花萼宽度、花瓣长度、花瓣宽度等四个特征,共150个样本。下面我将介绍如何对鸢尾花数据进行可视化分类。 1. 数据可视化 使用Python中的matplotlib和seaborn库对鸢尾花数据进行可视化。代码如下: ```python import seaborn as sns import matplotlib.pyplot as plt import pandas as pd iris = sns.load_dataset('iris') sns.pairplot(iris, hue='species', height=2.5) plt.show() ``` 运行结果如下图所示: ![iris visualization](https://i.imgur.com/UvIYbW1.png) 从图中可以看出,不同品种的鸢尾花在四个特征上有明显差异,可以用这些特征来对鸢尾花进行分类。 2. 数据分类 使用Python中的scikit-learn库对鸢尾花数据进行分类。代码如下: ```python from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score iris = load_iris() X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42) knn = KNeighborsClassifier(n_neighbors=3) knn.fit(X_train, y_train) y_pred = knn.predict(X_test) print('Accuracy:', accuracy_score(y_test, y_pred)) ``` 运行结果如下所示: ``` Accuracy: 1.0 ``` 使用KNN算法对鸢尾花数据进行分类,得到了100%的分类准确率。说明这四个特征对于鸢尾花分类是非常有效的。 以上就是对鸢尾花数据集进行可视化分类的简单介绍,希望对你有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值