【数据可视化】大规模多变量空间数据场可视化

        多维度(multi-dimensional)、多变量(multi-variate)、多模态(multi-modal)、多趟(multi-run多模型(multi-model)。多维度表达物理空间中独立变量的维数;多变量表达变量和属性的数目,表示数据所包含信息和属性的多寡;多模态强调获取数据的方法不同,以及各自对应的数据组织结构和尺度的不同;多趟和多模型亦可表示数据所含信息,但和多变量属于不同的概念,例如单变量多值数据,输入为同一个数据场,给定不同的计算参数或不同的计算模型得到不同的输出数据场,每个采样点含有属于同一个数据属性的多个值,其重点在于描述“值”的个数,而不是数据属性和变量的个数。

Chris Johnson2004年总结了科学可视化领域所面临的首要问题,其中四类问题的核心分别是高维时变分布式特征检测

大规模空间标量场数据的实时体可视化

         大规模标量场数据的快速可视化方法可以分为三个层次:硬件加速、信号处理与特征表达。硬件加速包括使用图形硬件的加速功能、采用并行计算、引入绘制流水线以及构建分布式多GPU架构;信号处理涉及绘制算法优化、多分辨率显示与数据压缩;特征表达则包括保特征压缩、图示与聚类等。

 

1.1大规模空间标量场数据的单机绘制

        大规模数据的单机绘制方法可以分为三类:硬件加速、数据压缩和外存计算。

        硬件加速是指基于图形硬件的快速绘制算法。

        数据压缩是解决大规模空间数据处理的主要思路。将标量场数据投影到小波基函数张成的空间,可获得不同分辨率下的绘制结果。LBGLinde Buzo Gray)算法应用于标量场手压缩,并分析原数据的多分辨率相关性,对层次化的矢量化,可大幅度减小显存的占用。Lindstrom提出了一种浮点格式数据进行快速压缩算法,该方法能够与应用程序的I/O环节无缝连接且适用于可变精度的浮点或整型数据。压缩后的可视化质量可采用合适的图像质量度量标准。

        对于无法存储于内存和显存的数据,可采用外存计算(out of core)处理大规模数据。细节层次技术是适用于不规则标量场数据可视化的外村计算方法。

 

1.2 大规模空间标量场数据的并行绘制

对于大规模的分布式绘制,综合考虑通信延迟与负载平衡对提升分布式系统的绘制性能至关重要,因而如何提高算法的并发性、设计负载均衡都是研究人员首先要关注的问题。

大规模空间数据的并行绘制研究可以分为CPUGPU集群并行计算两个阶段。

利用GPU构建分布式的计算与可视化平台是显卡工业发展的必然。Kniss等人利用GPU集群以及改良的I/O设备进行并行处理,实现了TB级时变数据的实时(5~10帧)绘制。面向流体仿真计算和可视化的新架构[Fogal2008]设计双层的体系结构,有机结合MPI与分布式共享内存DSM,大幅度提升计算机和绘制的效率。Fogal等人基于MPI在多GPU上实现大规模标量场数据的并行可视化,采用K-D树组织数据,并优化负载平衡,可在数秒内处理千亿级体素规模的数据集。

 

1.3 时变空间标量场数据加速绘制方法

   利用时空连贯性的特性,是加速时变看空间数据可视化的基本思路。

 

2 时变异构空间数据场的特征追踪与可视化

       就大规模、时变、异构的特点而言,时变空间标量场数据可视化既需要高性能、自适应的显示手段,突出用户感兴趣的特征,又需要能够融合不同的绘制方法,从多个角度辅助用户进行分析。就可视化系统的设计而言,应当将数据、特征、感知与交互作为核心要素。

        时变标量场数据可视化的两大挑战是数据的不规则与多变量:不规则表明了科学数据的复杂形态;多变量则是物理空间的本质特征。下面从特征提取、绘制与追踪三个层面介绍时变异构空间标量场数据的主要可视化方法。

 

2.1 时变空间标量场数据的特征提取

        按照空间大小、时变数据的特征可以分为局部特征和全局特征;按照时间变化规律,则可以分为常规、周期和随机三种模式。常规模式指特征在三维空间中稳定地移动或变形,其变化趋势既不是剧烈的变化,也不遵循周期性的路径。周期模式指特征周期性地出现和消失,或沿着周期性路径进行移动。随机模式指特征的变化规律较为随机,常见于湍流模拟。

 

2.2 异构数据的特征融合

异构数据的特征融合涉及多维度的融合多模态的融合两个方面。实现多维度融合可以采用信息可视化的相关方法,如平行坐标、散点图、时间直方图、纹理、影线、图标等。事实上,这类方法可以与人机交互、科学可视化紧密地结合。Seo等人提出了一种可根据用户指定的特征进行交互探索的方法。Love等人针对多维数据设计了三种绘制方法;基于统计特征分布、依赖于形状描述和使用系列代数操作,并在此基础上融合了轮廓线、等值面、流线以及迹线(path line)等多种绘制方法。Guo等人使用自组织映射(SOM)、平行坐标(PCP)、制图颜色等显示手段,结合三种层次的交互技术帮助用户发现多变量数据的时空特性。将维度投影与平行坐标结合起来也可以帮助用户交互地分析多维数据间的关联。

 

多态模拟融合的挑战在于数据的融合方式难以定义,空间分布也可能差异很大。因此,这类数据一般需先经过配准,并转化为相同格式后才能进行融合可视化。Cai等人提出了三种不同层次的多体混合方法,并对比了不同类型数据在光照、累积以及图像阶段混合的差异。Kreeger等人将半透明的网络数据与体数据进行融合,可同时可视化血管造影重建的几何网络和医学MRI影像。Noordmans等人提出了光谱体绘制,即对于不同数据场采用不同的光学模型,真实反映数据场中的结构特征。

   

 

2.3 时变空间标量场数据的特征追踪

    早期的特征跟踪方法采用计算机视觉、图形处理、计算几何等方法,直接保留和追踪流场特征。此后的方法基本围绕图示(illustration)、轮廓(contour)、视点和纹理等方法展开。

    小波变换可以结合表单用于分析和聚类时变数据,实现交互式多分辨率时变特征分析。重要性驱动的时变数据可视化方法利用信息论中的条件熵来计算数据相关性,通过聚类得到数据的重要度曲线,允许用户根据重要性在特征与时间构成的空间中分析数据。

    时变数据的特征追踪应结合多视图、用户交互以及可视化分析方法,从时间、数据与表现三个角度出发确定具体的可视化原则,例如,使用多视图从时变特性、多变量与空间属性三个维度进行探索。对于不同的时间表现形态应采用不同的可视化方法;以用户为中心,可以结合数据抽象、降维、聚集等多种手段辅助其进行分析;对于不同的交互时间,可以从事件指定、检测与展示三个角度进行交互行为设计。

 

 

 

注:摘自《数据可视化》

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值