VIS2020 长论文摘要机翻

推荐查看VIS的线上网址:IEEE VIS 2020 Virtual。总之,去看报告吧。

本次会议长论文共有33个会场,根据长论文的会场查看论文链接:IEEE VIS 2020 Virtual : VIS Full Papers 

中间有很多,保存失败,不再重新弄了。

会场0:奖

1.VATLD: A Visual Analytics System to Assess, Understand and Improve Traffic Light Detection(Best Paper Award)【自动驾驶——交通灯检测,领域应用扩展展示】

在自动驾驶中,交通灯检测对环境感知和决策至关重要。最先进的探测器建立在深度卷积神经网络(CNN)上,并展示了很有前途的性能。然而,基于CNN的探测器面临的一个问题是,在将其部署到自动驾驶汽车之前,如何全面评估其准确性和鲁棒性。在这项工作中,我们提出了一个视觉分析系统VATLD,配备了disentangled representation learning和语义对抗学习,以评估、理解和提高自动驾驶应用中的红绿灯探测器的准确性和鲁棒性

2.Visual Reasoning Strategies for Effect Size Judgments and Decisions (Best Paper Award)【不确定性相关,策略-实验-验证】

不确定性可视化通常强调point estimates点估计,通过可视化比较来支持量估计或决策。然而,当设计选择强调手段时,用户可能会忽略不确定性信息,将视觉距离误解为效应大小的代表。我们在Mechanical Turk上进行了混合设计实验,测试了8种不确定性可视化设计:95%包含区间、假设结果图、密度和分位数点图,每一种都添加了或不添加平均值。我们发现,在不确定性可视化中加入手段对幅度估计和决策都有较小的偏倚影响,与折现不确定性一致。我们还发现,支持偏差最小的效应量估计的可视化设计并不支持最佳决策,这表明当图表用户在不同的任务中使用相同的信息时,他们的效应量感觉不一定是相同的。

3.Objective Observer-Relative Flow Visualization in Curved Spaces for Unsteady 2D Geophysical Flows(Best Paper Award)【数学、科学计算流可视化、参照系/可视化领域扩展展示、可扩展性不强】

流体流动特征的计算和可视化通常依赖于给定输入速度场的观测器或参照系。因此,特征检测器的一个期望属性是它们是客观的,这意味着独立于输入参考系。然而,客观性的标准定义只适用于欧几里得域,而不适用于弯曲空间。我们建立在数学物理和黎曼几何的方法上,将客观性推广到弯曲空间,使用强大的对称群的概念作为定义客观性的基础。由此,我们建立了一个通用的数学框架,用于计算曲面的客观观测器场,相对于此,其他计算的度量变得客观。我们的框架的一个重要属性是,它本质上是在2D环境中工作,而不是在3D环境空间中。这使得通过从平面域到曲面域的优化实现了观察者场的二维计算的直接推广,而无需在3D中进行优化。我们特别发展了非定常二维地球物理流在球体(如地球)上的情况。曲面上的观察者场使目标特征计算以及标量场和矢量场时间演化的可视化成为可能,这样自动计算的参照系就会以一种使它们看起来稳定的方式跟随运动结构,比如漩涡。

我们举例说明了相对于流场特征的时间演化,观测者运动的自动计算,例如这里显示的时变全球风数据集,中心特征为飓风Isabel(2003)。通过全局优化自动计算观测场,最小化观测时间导数,使观测场尽可能稳定,从而实现相对特征可视化。相对于观测场,飓风看起来是静止的,地球在下面反向移动。这使得可以直接分析特征的时间演化。

会场1:Creating & Sharing Visualizations

4.PlotThread: Creating Expressive Storyline Visualizations using Reinforcement Learning【故事线-reinforcement learning框架→PlotThread工具→设计时+AI agent协作,可扩展性较强,趣味性较强,但是前期补足的工作较多

使用PlotThread创建的故事线可视化示例。布局是通过AI agent和设计师之间的协作设计产生的,而风格和视觉标签是手工定制的,以美化故事线。

故事线可视化是呈现情节演变和揭示人物之间风景互动的有效手段。然而,故事线视觉化的设计是一项艰巨的任务,因为用户需要平衡美学目标和叙事约束。尽管基于优化的方法在产生美感和清晰的布局方面有了显著的改进,但现有的(半)自动化方法在1)有效探索故事线设计空间和2)灵活定制故事线布局方面仍然存在局限性。在这项工作中,我们提出了一个强化学习reinforcement learning框架来训练一个AI agent,帮助用户高效地探索设计空间,并生成优化的故事情节。在这个框架的基础上,我们引入了PlotThread,这是一个创作工具,它集成了一组灵活的交互,支持轻松定制故事线的可视化。为了无缝地将人工智能融入创作过程,我们采用了混合主动的方法,即人工智能和设计师在同一块画布上工作,以促进故事情节的协同设计。

5.Lyra 2: Designing Interactive Visualizations by Demonstration【边演示,边穿件可能的交互设计,是一种动态的、可直接操作的机制。较新、进行扩展工作的可能较大】

一个在可视化设计环境Lyra 2中设计的交互式可视化示例。用户可以(a)刷散点图重新聚合直方图,(b)单击直方图条过滤散点图中对应的点。这个可视化是通过演示设计的——用户不需要编写任何文本代码。

 最近的图形界面为创建可视化提供了直接操作机制,但在很大程度上限于静态输出。要创作交互式可视化,用户必须转而求助于文本规范,但这种方法带来了更高的技术负担。为了弥补这一差距,我们引入了Lyra 2,这是一个通过演示来创建交互技术的新方法扩展了先前的可视化设计环境的系统。用户直接在他们正在编辑的可视化上执行交互(例如,按钮点击、拖拽或按键)。系统使用一组启发式方法来解释这种性能,并列举可能的交互设计的建议。这些启发式方法考虑了交互的属性(例如,目标和事件类型)以及可视化(例如,标记和缩放类型,以及多个视图)。交互设计建议以缩略图的形式显示;用户可以预览和测试这些建议,通过附加的演示迭代地改进它们,最后通过属性检查器应用和定制它们。

6.StructGraphics: Flexible Visualization Design through Data-Agnostic and Reusable Graphical Structures【允许设计师通过在画布上绘制图形来构建可视化设计,然后结构化它们的视觉属性,而不依赖于具体的数据集或数据模式,不编程,定制可视化

StructGraphics允许设计师通过在画布上绘制图形来构建可视化设计,然后结构化它们的视觉属性,而不依赖于具体的数据集或数据模式。StructGrapher的用户界面包括:一个可重用的可视化结构库,一个用于绘制基本形状并将它们分组到集合中的可视化素描器,一个用于暴露和结构化图形属性的属性检查器,以及一个用于创建属性和数据之间映射的电子表格。

 信息可视化研究已经开发出功能强大的系统,使用户可以在没有文本编程的情况下编写自定义数据可视化。这些系统可以通过连接惰性数据绑定机制和矢量图形编辑工具来支持图形驱动的实践。然而,尽管可视化创作系统具有强大的表达能力,但它们通常假设用户想要生成他们脑海中已经存在的视觉表示,而不是探索设计。它们还强制了一个数据到图形的工作流,其中将数据维度绑定到图形属性是生成可视化布局的必要步骤。在本文中,我们引入了StructGraphics,这是一种创建数据无关且完全可重用的可视化设计的方法。StructGraphics允许设计师通过在画布上绘制图形来构建可视化设计,然后在不依赖数据集或数据模式的情况下构造它们的视觉属性。在StructGraphics中,表格数据结构直接从图形的结构派生出来。之后,设计师可以通过电子表格用户界面将这些结构与真实的数据集联系起来。StructGraphics通过结合图形属性共享、实例设计规范和持久布局约束,支持复杂数据可视化的设计和重用。

7.VisCode: Embedding Information in Visualization Images using Encoder-Decoder Network【输入:可视化图片,处理整合,输出新的可视化图片:图形颜色转换、信息嵌入等,可参考的入手方向,深度学习知识需要,编程需要】

本文提出了一种新的可视化图像信息嵌入方法——VisCode。VisCode可以用于各种实际应用。输入是一个静态可视化图像。根据编码规则,在执行解码操作后,可以对原始视觉样式进行重定向。可视化重新定位包括表达(a)和主题颜色(b)。VisCode还可以用于(c)所示的元数据嵌入和大规模信息嵌入。在将源代码解码为静态图像后,我们可以快速构建一个可视化应用程序,并应用常见的交互,如(d)所示的选择。

 我们提出了一种名为VisCode的方法来将信息嵌入到可视化图像中。该技术可以隐式地将用户指定的数据信息嵌入到可视化中,同时确保编码的可视化图像不失真。VisCode框架是基于深度神经网络的。我们建议使用可视化图像和QR码数据作为训练数据,并设计一个鲁棒的深度编码器-解码器网络。设计的模型考虑了可视化图像的显著特征,以减少编码造成的显式视觉损失。为了进一步支持大规模编码和解码,我们考虑信息可视化的特点,提出了一种基于显著性的二维码布局算法。我们介绍了VisCode在信息可视化环境中的多种实际应用,并对编码的感知质量、解码成功率、抗攻击能力、时间性能等进行了综合评估。评价结果验证了VisCode的有效性。

8.Chartem: Reviving Chart Images with Data Embedding【将信息嵌入到图表图像中作为不易察觉的背景模式,通过确定和解码背景模式来恢复嵌入的信息,将信息嵌入背景,很讨巧

Chartem概述:将信息嵌入到图表图像中作为不易察觉的背景模式,通过确定和解码背景模式来恢复嵌入的信息。

实际上,图表被广泛存储为位图图像。虽然它们很容易被人类consumed,但不方便用于其他用途。例如,更改图表样式、类型或图表图像中的数据值实际上需要完全重新创建一个新的图表,这通常是一个耗时且容易出错的过程。为了辅助这些任务,人们提出了许多方法,利用计算机视觉和机器学习技术从图表图像中自动提取信息。虽然他们取得了很有希望的初步结果,但在鲁棒性和准确性方面仍有许多挑战需要克服。在本文中,我们提出了一种新的替代方法Chartem,直接从根源解决这个问题。具体地说,我们设计了一个数据嵌入模式,将大量的信息编码到图表图像的背景中,而不影响人类对图表的感知。当从图像中提取嵌入的信息时,可以使各种可视化应用程序重用或重用图表图像。

9.Dataless Sharing of Interactive Visualization【交互式可视化缺点:数据密切依赖,解决方式:将交互式可视化捕获为独立的无数据对象,用户与对象交互,类比中间嵌入虚拟层。

(A)策展人指定他们想要分享的可视化互动元素。Loom在一个独立于原始数据和应用程序的可共享对象中捕获并存储交互体验。(B)终端用户可以在web浏览器中与共享的Loom对象进行交互,而不需要依赖任何数据。

交互式可视化已经成为一种强大的洞察性媒体。然而,交互式可视化对其数据的密切依赖抑制了其可共享性。用户必须在两种极端之间做出选择:(i)共享非交互式的无数据格式,如图像和视频,或(ii)将其数据和软件的访问权交给无法控制数据将如何使用的其他人。在这项工作中,我们填补了两个极端之间的差距,并提出了一个新的系统,称为Loom。Loom将交互式可视化捕获为独立的无数据对象。用户可以与Loom的对象进行交互,就好像他们仍然拥有创造这些可视化的原始软件和数据一样。然而,Loom的对象是完全独立的,因此可以在不需要数据或可视化软件的情况下在线共享。Loom的对象可以有效地存储和使用,并提供隐私保护机制。

10VisConnect: Distributed Event Synchronization for Collaborative Visualization【基于web的同步分布式协作可视化系统,支持大多数基于web的SVG数据可视化,平衡了系统的安全性和响应性,并支持许多协作者的同时交互

三个分布式协作者分析一个node-link network可视化,每个协作者通过拖拽节点进行同步交互。这是通过向现有的D3.js节点链接可视化添加两行VisConnect代码实现的。随着世界越来越依赖远程协作,VisConnect等系统有助于保持数据可视化用户的连接和有效。

 越来越多的工具和接口被期望是同步的和分布式的,以适应远程协作。然而,采用这些技术进行数据可视化的程度较低,部分原因是开发困难:现有的协作软件系统要么不支持同时交互,要么需要对现有的可视化进行昂贵的重新开发。我们贡献了VisConnect:一个基于web的同步分布式协作可视化系统,支持大多数基于web的SVG数据可视化,平衡了系统的安全性和响应性,并支持许多协作者的同时交互。VisConnect通过在客户端之间同步底层JavaScript事件,使可视化更新在客户端之间透明地进行,从而使现有的可视化实现几乎没有代码更改。这是通过对等系统实现的,该系统在客户端之间就每个元素的事件序列建立共识,并使用锁服务将对元素的访问权授予客户端。我们贡献了传统可视化交互技术的协作扩展,例如拖动、画笔和套索,并讨论了协作可视化交互的不同策略。

11.A Generic Framework and Library for Exploration of Small Multiples through Interactive Piling(Honorable Mention)的【可以小关注下小倍数这个概念】

交互式的小倍数视觉堆叠,用于分组,布置,预览,浏览,和大集合的视觉工件的聚合

 小倍数是在许多领域中普遍使用的视觉信息的微型表示。处理大量的小倍数对许多分析任务(如检查、比较、导航或注释)带来了挑战。为了解决这些挑战,我们开发了一个框架,并实现了一个名为piling .js的库,用于设计交互式桩接口。这种界面基于堆砌的隐喻,通过交互式地将视觉对象聚集成桩,灵活地组织、探索和比较大量的小倍数。

12.NL4DV: A Toolkit for Generating Analytic Specifications for Data Visualization from Natural Language Queries

概述基于自然语言查询生成可视化的步骤。NL4DV封装了查询处理和可视化推荐组件,提供抽象函数来支持它们的功能。使用数据集初始化之后,NL4DV解析输入的NL查询并返回相关信息(根据数据属性和分析任务)和有序的Vega-Lite规范列表。

 自然语言界面(NLIs)在可视数据分析方面显示出巨大的潜力,它允许人们灵活地指定可视化并与之交互。然而,开发可视化NLIs仍然是一项具有挑战性的任务,需要较低水平的自然语言处理(NLP)技术以及可视化分析任务和可视化设计的知识。我们提出了NL4DV,一个用于自然语言驱动的数据可视化的工具包。NL4DV是一个Python包,它接受表格数据集和关于该数据集的自然语言查询作为输入。作为响应,该工具包返回一个建模为JSON对象的分析规范,其中包含数据属性、分析任务和与输入查询相关的Vega-Lite规范列表。通过这样做,NL4DV帮助那些可能没有NLP背景的可视化开发人员,使他们能够创建新的可视化NLIs或将自然语言输入纳入他们现有的系统中。

13.P6: A Declarative Language for Integrating Machine Learning in Visual Analytics

P6提供了一种声明性语言(a),用于使用聚类和降维方法指定可视化分析过程来分析数据集。声明性规范由P6的运行时(B)处理。还可以添加交互规范(C),为分析聚类和降维结果(D)提供交互式可视化。

 我们提出了P6,这是一种声明性语言,通过它对指定和集成机器学习和交互式可视化方法的支持,用于构建高性能的视觉分析系统。随着基于机器学习和人工智能的数据分析方法的不断发展,视觉分析解决方案可以利用这些方法更好地利用大型和复杂的数据。然而,将机器学习方法与交互式视觉分析相结合是具有挑战性的。现有的可视化声明性编程库和工具包缺乏对耦合机器学习方法的支持。通过提供可视化分析的声明性语言,P6可以让更多的开发人员创建可视化分析应用程序,将机器学习和可视化方法结合起来,用于数据分析和解决问题。

14.PipelineProfiler: A Visual Analytics Tool for the Exploration of AutoML Pipelines

近年来,各种各样的自动化机器学习(AutoML)方法被提出来生成端到端MLpipelines。尽管这些技术促进了模型的创建,但考虑到它们的黑盒特性、底层算法的复杂性以及它们衍生的大量管道,开发人员很难对它们进行调试。对于机器学习专家来说,选择一个非常适合给定问题的AutoML系统也是一个挑战。在本文中,我们介绍了PipelineProfiler,这是一个交互式可视化工具,允许探索和比较AutoML系统产生的机器学习(ML)管道的解决空间。PipelineProfiler与Jupyter Notebook集成在一起,可以与常见的数据科学工具相结合,以支持对ML管道的丰富分析,为用户提供更好的理解生成它们的算法以及如何改进它们的见解。

15.Kyrix-S: Authoring Scalable Scatterplot【可扩展散点图】 Visualizations of Big Data

由Kyrix-S及其Kyrix-S规范创建的可扩展散点图可视化。从2013年1月到2015年2月,reddit上用户发表的10亿条评论被15个缩放级别可视化。在每个层次上,X轴和Y轴分别是评论的发表时间和长度。每个圈代表一组评论。每个圆内的数字是簇的大小,也编码了圆的半径。使用平移或缩放,用户可以获得概述(左)或检查一个感兴趣的区域(中)。人们可以将鼠标悬停在一个圆圈上,看到集群中三个得分最高的评论,以及一个显示集群边界的边框。

静态散点图在大数据集上经常会遇到对象重叠导致视觉混乱的问题。对散点图进行放大可以帮助缓解这个问题。通过多个缩放级别,可以获得更多的屏幕空间,允许对象以一种不那么拥挤的方式放置。我们称这种类型的可视化为可扩展散点图可视化,简称SSV。尽管ssv具有潜力,但由于三个方面的限制,现有的系统和工具包在支持ssv的编写方面存在不足。首先,许多系统的可伸缩性有限,假设数据只适合一台计算机的内存。第二,太多的开发工作,例如,使用自定义代码来生成标记布局或渲染对象,是必需的。第三,许多系统只关注SSV设计空间的一小部分(例如支持特定类型的视觉标记)。为了解决这些限制,我们开发了Kyrix-S,这是一个易于大规模编写ssv的系统。

Perception & Color

16.Semantic Discriminability for Visual Communication【理论-实验-验证-结论,语义距离、知觉距离】

这项研究调查了不同的知觉和语义距离如何影响人们理解调色板的能力。我们发现,语义距离的增加提高了表现,不受知觉距离的变化的影响,当这两个因素不相关时,反应是由语义距离主导的。这些结果对视觉传达的调色板设计优化有指导意义。

为了解释信息可视化,观察者必须确定视觉特征如何映射到概念上。首先,这种能力取决于知觉的辨别能力;例如,观察者必须能够看到不同颜色之间的差异,以便这些颜色传达不同的含义。然而,解释视觉化的能力也取决于语义的可分辨性,即观察者在不借助图例或标签等语言线索的情况下,能够区分编码系统中每个概念对应的视觉特征的程度。先前的证据表明,与最大化颜色-概念关联强度的系统相比,最大化语义距离(最大化已分配颜色和概念之间的关联强度,同时最小化未分配颜色和概念之间的关联强度)的颜色编码系统的语义鉴别能力更高。然而,语义距离的增加也会导致感知距离的增加,所以还不清楚是哪个因素导致了性能的提高。本研究通过两个实验验证了语义距离和知觉距离对条形图数据可视化语义判别能力的独立影响。感知距离的选择足够大,以确保颜色不只是明显不同。我们发现,语义距离的增加提高了表现,不受知觉距离的变化的影响,当这两个因素不相关时,反应是由语义距离主导的。

17.Rainbows Revisited: Modeling Effective Colormap Design for Graphical Inference【颜色映射的有效性,像彩虹这样的彩色地图具有认知优势,它们表现出高度的颜色分类能力】

 我们研究中的八个例子。对于每一组阵容,四个图形中哪一个看起来与众不同?这个图形推理测试使我们能够确定不同颜色图设计的区别能力。我们的结果提出了一个新的模型来预测颜色映射的有效性,特别是在涉及基于模型的推理和判断的任务中。

颜色映射是标量数据可视化的基本技术。以前的文献提供了有效的色彩图设计指南,例如强调亮度变化,同时限制色调的变化。然而,对颜色的实证研究主要集中在知觉任务上。这种狭隘的关注抑制了我们对这些指导原则的普遍性的理解,特别是对于视觉推理这样需要跨多种感知进行综合和判断的任务。此外,强调传统的坡道设计(例如,顺序或分流)可能会忽略其他关键指标或设计策略。我们研究了一种认知度量——颜色名称变化——如何影响人们做出基于模型的判断的能力。在两个图形推理实验中,参与者看到了一系列从不同模型中采样的彩色标记标量字段,并评估了这些模型之间的关系。与传统的指导方针相反,参与者在观看跨越各种独特名称的颜色的彩色地图时更准确。我们使用这个指标对参与者的表现进行建模,发现它比现有的设计原则更符合实验数据。我们的研究结果表明,像彩虹这样的彩色地图具有认知优势,它们表现出高度的颜色分类能力,尽管它们传统上不受欢迎的感知特性

18.A Testing Environment for Continuous Colormaps【Colormaps测试环境】

 在这个图中,您可以看到CCC-Tool测试部分的屏幕截图。新增一节介绍如何使用测试函数来求值colormap。我们实现了广泛的函数来处理2D标量字段的许多局部和全局属性。在选择的“交互式测试”选项卡,用户可以单独修改测试功能。

许多计算机科学学科(例如,组合优化、自然语言处理和信息检索)使用标准或建立的测试套件来评估算法。在可视化中,类似的方法已经在一些领域被采用(如体可视化),而在大多数其他领域,用户证词和实证研究已经成为主要的评估手段,如设计colormaps。在本文中,我们提出建立一个测试套件来评估colormaps的设计。使用该组件,用户可以观察到对平面标量场应用不同的连续色图时的效果,这些平面标量场可能表现出各种特征,如跳跃、局部极值、脊线或谷线、标量值的不同分布、不同梯度、不同信号频率、不同噪声水平等。该套件还包括一个可扩展的真实世界数据集集合,包括可视化文献中最流行的colormap测试数据。

19.Truth or Square: Aspect Ratio Biases Recall of Position Encodings

 左边的Mekko图使用高度来编码相对市场份额,类似于条形图。但目前的结果表明,每个标记的纵横比可能会影响这种高度判断。当被要求重现柱状图中单个条形标记的垂直位置时,宽宽比的条形被高估,高比率的条形被低估,而方形比的条形没有系统偏差。这种偏差模式出现在记忆中,表明跨时间和空间发生的价值比较(例如,在单独的图表中的条形图)很可能会被扭曲。

20.No mark is an island: Precision and category repulsion biases in data reproductions

 一个约束是选择一种最精确地将数据值传递给眼睛的数据编码。使用哪种数据编码通常是基于过去的工作,即根据参与者口头报告两个值之间的比率的精确程度对视觉编码进行排名。这种部分到整体的判断在许多任务中都是有用的,但它也混淆了三个错误来源:提取单个值的实际视觉精度,这些值之间的比率计算,以及将视觉比率转换为符号数字。在这里,我们探索了一个替代的措施,捕捉视觉误差独立于这些其他来源。

数据可视化之所以强大,很大程度上是因为它促进了数值的可视化提取。然而,现有的数据通道感知精度测量(例如,位置、长度、方向等)主要基于两个值之间的比率判断的口头报告(例如,Cleveland & McGill 1984)。口头报告合并了超出实际视觉精度的多种错误来源,引入了这些值之间的比率计算,并要求将该比率转换为口头数字。在这里,我们观察到通过消除比率计算和口头报告来衡量精度的原始标准;我们只是要求参与者重现标记(单个条形或圆点)来匹配之前看到的标记。我们可以控制标记最初是单独呈现(后来绘制),还是与参考配对(例如,在测试中也会出现第二个“100%”条,或者点的y轴),或者与参考整合(将参考条合并成一个堆叠的条形图,或者将点直接放置在轴上)。较小的重现值被高估,较大的重现值被低估,这表明存在系统性记忆偏差。平均复制误差约为实际值的10%,无论复制是否在与原始数据相同的基线上完成。在参考条件和(尤其是)综合条件中,响应被排斥在参考标记的隐含中点,即50%以上的值被高估,50%以下的值被低估。

21.Revealing Perceptual Proxies with Adversarial Examples【没看懂这篇论文倒底在说什么】

我们提出了两种方法来揭示视觉系统如何从可视化中提取统计数据,通过将正确的答案与候选感知代理的对抗性模型进行比较。(A)在“理论驱动”方法中,我们优化图表来操纵推测的感知代理,并测试它们对判断的影响有多大。(B)在“数据驱动”方法中,我们试图重新发现欺骗性图表,使用人类判断作为目标函数。

数据可视化将数字转换为视觉标记,使我们的视觉系统可以从图像中提取数据,而不是原始数字。显然,视觉系统不像计算机那样计算这些值,例如,通过计算算术平均值或相关性。相反,它使用感知代理提取这些模式;视觉标记的启发式捷径,如质心或包络线。了解人们实际使用的代理将导致更有效的可视化。我们展示了一系列众包实验的结果,这些实验衡量了在比较以柱状图形式呈现的数据序列对的平均值和范围时,一组候选代理如何强有力地解释人类的表现。我们生成的数据集中,正确的答案—具有较高算术平均值或范围的系列—与“对抗性”系列进行比较,如果查看者使用特定的候选代理,应该将其视为较高的结果。通过阶梯式设计,我们寻找了每个对抗性代理驱动观众做出错误回答的强度的指标,从而得出该代理是否与观众的实际操作相一致的证据。然后,我们使用层次模型来研究不同的个体是否会选择不同的代理。

Vulnerabilities in Machine Learning

22.Auditing the Sensitivity of Graph-based Ranking with Visual Analytics【基于图的算法的敏感性】

案例研究的框架界面:政治博客HITS的敏感性分析。

图挖掘在许多学科中扮演着关键的角色,并且已经开发了各种算法来回答谁/什么类型的问题。例如,在一个电商平台上,我们应该向一个用户推荐什么商品?这类问题的答案通常以排序列表的形式返回,基于图的排序方法在工业信息检索设置中被广泛使用。然而,这些排名算法具有多种敏感性,即使排名的微小变化也会导致产品销量和页面点击量的大幅下降。因此,需要工具和方法来帮助模型开发人员和分析人员探索图排序算法相对于图结构中的扰动的敏感性。在本文中,我们提出了一个可视化分析框架,通过执行基于扰动的假设分析来解释和探索任何基于图的排名算法的敏感性。

23.Visual Analysis of Discrimination in Machine Learning【机器学习中的歧视】

在犯罪预测和大学录取等关键应用中,自动化决策的使用越来越多,这引发了人们对机器学习公平性的质疑。我们如何决定不同的待遇是合理的还是歧视性的?在本文中,我们从视觉分析的角度研究机器学习中的区分,并提出了一个交互式可视化工具DiscriLens,以支持更全面的分析。为了揭示算法区分的详细信息,DiscriLens基于因果建模和分类规则挖掘确定了一个潜在区分项集集合。通过将扩展的欧拉图与基于矩阵的可视化相结合,我们开发了一种新颖的集可视化方法,以促进歧视性项集的探索和解释。

24.Selection-Bias-Corrected Visualization via Dynamic Reweighting

 回顾式可视化分析容易产生各种选择偏差效应,特别是对于高维数据,在任何给定的时间只显示了维数的子集。动态重加权(DR)是一种新的计算方法,以减少选择偏差,帮助用户制作偏差校正的可视化。本文介绍了容灾工作流程,介绍了关键的DR可视化设计,并给出了支持DR过程的统计方法。还报告了医学领域的用例,以及领域专家用户访谈的结果。

从复杂系统(如电子健康记录或点击流数据)收集和可视分析大规模数据在各个行业中越来越普遍。然而,这种类型的回顾性可视化分析容易产生各种选择偏差效应,特别是对于高维数据,在任何给定的时间只显示了维的子集。当分析人员在特别分析期间动态地应用过滤器或执行分组操作时,选择偏差的风险甚至更高。这些偏见的影响威胁了在视觉分析中发现的作为决策基础的洞察力的有效性和普遍性。过去的工作集中在偏见透明度上,帮助用户理解选择偏见何时可能发生。然而,通过减少偏差来抵消选择偏差的影响通常留给用户作为一个单独的过程来完成。动态重加权(DR)是一种新的计算方法,以减少选择偏差,帮助用户制作偏差校正的可视化。本文介绍了DR工作流程,介绍了关键的DR可视化设计,并给出了支持DR过程的统计方法。

25.ConfusionFlow: A model-agnostic visualization for temporal analysis of classifier confusion【分类模型性能分析】

 ConfusionFlow是一个用于分类模型性能分析的交互式可视化工具。它引入了一种新颖的混淆矩阵的时间适应性,让模型开发人员在一段时间内比较多个分类器的学习行为。

分类器是最广泛使用的监督机器学习算法之一。存在许多分类模型,为给定的任务选择正确的分类模型是困难的。在模型选择和调试过程中,数据科学家需要评估分类器的性能,评估它们随时间的学习行为,并比较不同的模型。通常,这种分析是基于单个数字的性能度量,如准确性。通过检查类错误,可以对分类器进行更详细的评估。混淆矩阵是可视化这些类错误的一种既定方法,但它在设计时并没有考虑到时间或比较分析。更一般地,已建立的性能分析系统不允许对类级别信息进行时间和比较分析。为了解决这个问题,我们提出了ConfusionFlow,这是一个交互式、比较的可视化工具,它结合了类混淆矩阵的优点和性能随时间变化的可视化特征。ConfusionFlow是模型无关的,可以用于比较不同模型类型、模型架构和/或训练和测试数据集的性能。

26.ConceptExplorer: Visual Analysis of Concept Drifts in Multi-source Time-series Data

在时间序列数据中跟踪复杂相关性的演变是具有挑战性的。为了解决这一问题,我们首先检测预测模型在显著变化时的精度下降。在两次变化之间的时间段的模式可以被认为是一致的。因此,可以整合相关的数据记录进行分析。

 时间序列数据被广泛研究在各种场景,如天气预报,股票市场,客户行为分析。为了全面地了解动态环境,需要从多个数据源理解特征。本文提出了一种新的可视化分析方法,用于检测和分析多源时间序列中的概念漂移。提出了一种基于预测模型的多源时间序列概念漂移视觉检测方案。我们设计了一个drift level index来描述动力学,并设计了一个一致性判断模型来证明概念从不同来源漂移是否一致。我们集成的可视化界面ConceptExplorer有助于从多源时间序列数据中对概念和概念漂移进行可视化探索、提取、理解和比较。

27.Diagnosing Concept Drift with Visual Analytics【概念漂移】

概念漂移是指数据流的分布随时间以不可预见的方式发生变化,导致建立在历史数据上的预测模型变得不准确的现象。虽然已经开发了各种自动化方法来识别何时发生概念漂移,但对于分析人员来说,当检测到概念漂移时,他们需要理解和纠正他们的模型,但支持有限。在本文中,我们提出了一种可视化分析方法DriftVis,以支持模型构建者和分析师识别和纠正流数据中的概念漂移。DriftVis将基于分布的漂移检测方法与流散点图相结合,以支持对数据流分布变化引起的漂移的分析,并探索这些变化对模型精度的影响。

Making Sense of Text

28.TransVis: Integrated Distant and Close Reading of Othello Translations【关注:翻译随时间的变化,有趣】

研究随着时间推移的翻译的变化是一个有价值的文化遗产研究领域。了解翻译的差异,可以揭示文化、意识形态甚至政治对文学的影响以及作者关系。在本文中,我们介绍了一个新颖的集成视觉应用程序,以支持远程和近距离阅读奥赛罗译本集。我们提出了一种新的交互式应用程序,它提供了所有翻译及其对应的对齐概述,并具有平滑的缩放和平移功能,使远程和近距离阅读在同一视图中集成。我们提供了一系列筛选和选择选项,以自定义对齐概述以及关注特定子集。选择和过滤响应专家用户的偏好,并交互式地更新分析文本指标。此外,我们引入了一个用于细读的定制视图,它保留了选择的历史和对齐概述状态,并允许回溯和重新检查它们。

29.Visual Analysis of Argumentation in Essays

 本文提出了一个视觉分析系统,用于研究、分析和比较文章语料库中的论点结构。我们提供了一个语料库的概述,通过一个ArguLines列表,表示每篇文章的论点单位的一系列字形。每个字形编码一个参数单元的立场、深度和相对位置。概览可以以各种方式进行排序,以揭示模式和异常值。文章的子集可以使用论点单位出现树进行详细的选择和分析,该树使用层次直方图聚合论点结构。这种分层的观点有助于估计有关论文中论证进展的统计数据和趋势。它还提供了对所选子集之间的共性和差异的见解。文本视图是验证来自其他视图的结论和注释过程的必要文本基础。它还提供了对所选子集之间的共性和差异的见解。文本视图是验证来自其他视图的结论和注释过程的必要文本基础。将视觉过滤的观点和交互技术联系起来,研究文章子集中立场的演变,并仔细检查议论文单元的顺序,使文章语料库的深入分析成为可能。

30.A Survey of Text Alignment Visualization【关注:文本对齐的综述】

 三种文本对齐场景集中在哈姆雷特的独白:(a)整理场景显示《哈姆雷特》的四开本Q1和第一版对开本之间有相似或相等的线对齐,(b)文本重用场景突出了“To be, or not To be”的变体——引用塞缪尔·泰勒·柯勒律治的三个不同文本(直线表示准确的引用,变体与虚线链接),和(c)翻译场景将演讲第一句“not to be”的不同翻译联系起来(在乌兹别克语中,“not to be”意为死亡)。

文本对齐是自然语言处理、计算语言学和数字人文学科等文本相关领域的基本技术之一。它比较两个或两个以上的文本,目的是找到相似的文本模式,或估计文本的差异或相似程度。可视化对齐结果是一项必要的任务,因为它有助于研究人员获得单个发现和整体模式结构的全面概述。根据文本大小、对齐方法,以及最重要的对齐要求的基本研究任务,已经开发了不同的方法来可视化和帮助理解这些模式。在这些任务的基础上,我们回顾了现有的文本对齐可视化方法,并讨论了它们的优点和缺点。

31.A Virtual Reality Memory Palace Variant Aids Knowledge Retrieval from Scholarly Articles【关注,虚拟现实记忆宫殿,用来记忆科学知识

虚拟现实记忆宫殿,用来记忆科学知识

 我们提出探索性的研究虚拟现实技术和助记装置,以协助从学术文章检索知识。我们用科学出版物的摘要来代表学术文章中的科学知识;参与者被要求从一组摘要中阅读、记忆和检索知识。我们进行了一项实验,比较参与者在三种不同条件下的回忆和识别表现:一种没有预先指定的策略来测试基本个人记忆能力的控制条件,一种使用名为“记忆宫殿”的基于图像的助记法变体的条件,以及一种使用基于虚拟现实的记忆宫殿变体的条件。我们的分析表明,使用基于虚拟现实的记忆宫殿变体大大增加了检索和保留的知识量,比其他基于图像的记忆宫殿变体有一定的改善。

32.ArchiText: Interactive Hierarchical Topic Modeling【文本数据的层次化主题建模】

人在循环Human-in-the-loop的主题建模允许用户探索和控制过程,以产生符合他们需求的更高质量的主题。当集成到可视化分析系统中时,许多现有的自动化主题建模算法会被赋予交互参数,以允许用户调整它们。但是,当算法不容易适应变化,难以实现底层算法紧密支持的交互性时,这就有局限性。相反,我们强调紧密集成的概念,提倡并行地共同开发交互式算法和交互式可视化分析系统,以允许灵活性和可伸缩性。在本文中,我们描述了高效和有效地执行计算、可视化和交互紧密集成概念的设计目标,以实现文本数据的分层主题建模。我们提出了交互式任务的计算基础操作,以实现设计目标。为了实例化我们的概念,我们提出了ArchiText,这是一个用于交互式层次主题建模的原型系统,它通过紧密集成提供了快速、灵活和算法有效的分析。利用交互式层次主题建模,我们的技术允许用户生成、探索和灵活地控制层次主题,以发现更有信息的主题及其文档成员关系。

33.Attention Flows: Analyzing and Comparing Attention Mechanisms in Language Models【语言模型中的注意机制,图很好看】

 我们提出Attention Flows,一个可视化的工具来分析和比较语言模型中的注意机制。我们的方法支持语言模型中注意机制的比较。我们比较了BERT模型(蓝绿色)和它的微调对应(紫色),以确定问题-答案对的有效性(a)。通过选择单词“什么”,与BERT相比,微调模型关注答案“jacksonvillians or jaxons”(c),完整的句子上下文如(b)所示。

语言建模的进步导致了基于深度注意力的模型的发展,这些模型可以解决各种各样的自然语言处理(NLP)问题。这些语言模型的典型特征是在大型未标记文本语料库上进行训练前的过程,然后针对特定任务进行微调。虽然已经有大量的工作致力于理解预训练模型的注意机制,但对模型的注意机制如何在目标NLP任务训练时发生变化的了解较少。在本文中,我们提出了一种视觉分析方法来理解基于注意的语言模型中的微调。我们的可视化“注意力流”旨在支持用户在基于转换器的语言模型中查询、跟踪和比较层内、层间以及注意力头部之间的注意力。为了帮助用户了解分类决策是如何做出的,我们的设计集中在描述最深层的基于分类的注意力,以及来自前一层的注意力如何在输入的单词中流动。

34.OoDAnalyzer: Interactive Analysis of Out-of-Distribution Samples

 一种理解由训练数据和测试数据之间的分布差异引起的分布外(OoD)样本的可视化分析方法:(A)控制和可视化辅助工具;(b)基于网格的可视化来说明上下文中的OoD样本。网格单元格和边框的颜色编码类别,顺序配色代表样本的OoD得分;(c)图像和(d)所选区域的显著图表示。

预测模型性能下降的一个主要原因是测试样本没有被训练数据很好地覆盖。这种代表性不佳的样本被称为OoD样本。在本文中,我们提出了OoDAnalyzer,一种可视化的分析方法,用于交互式地识别OoD样本并在上下文中解释它们。我们的方法集成了一个整体OoD检测方法和一个基于网格的可视化。

Sense & Explainabilities

35.HypoML: Visual Analysis for Hypothesis-based Evaluation of Machine Learning Models【基于假设的机器学习评估】

HypoML是一种新型的ml测试框架,它将传统的统计假设测试与对多个假设的结论进行逻辑推理相结合,将多线程测试数据转化为可视化的表示形式,用于快速观察结论。

 在本文中,我们提出了一个可视分析工具,使基于假设的机器学习(ML)模型的评估成为可能。我们描述了一个新的ml测试框架,它结合了传统的统计假设测试(通常在实证研究中使用)和关于多个假设的结论的逻辑推理。该框架定义了一个受控配置,用于测试一些关于“概念”或“特性”的额外信息是否以及如何有利于或阻碍ML模型的假设。因为对多个假设的推理并不总是直接的,所以我们提供了HypoML作为一个可视化分析工具,使用它,多线程测试结果首先通过统计和逻辑推理转化为分析结果,然后转化为一个可视化表示,用于快速观察结论和测试结果与假设之间的逻辑流。

36.Explainable Matrix - Visualization for Global and Local Interpretability of Random Forest Classification Ensembles

解释矩阵(ExMatrix)是一种基于逻辑规则可视化表示的随机森林(RF)可解释性方法。ExMatrix支持全局和局部解释,支持RF模型分析和分类结果审计。关键思想是使用类似矩阵的隐喻来探索逻辑规则,其中行是规则,列是特性,单元格是规则谓词。ExMatrix允许同时对相当数量的规则进行推理,通过使用规则/行和特性/列的不同排序帮助用户建立见解,支持整个RF模型的概述,同时也支持根据需要关注特定部分的细节。

 在过去的几十年里,分类模型已经被证明是重要的机器学习工具,其潜力和适用性在各个领域。在这些年中,北方的大多数研究人员一直在改进质量指标,尽管缺乏关于模型决策的信息,这些指标传达。最近,这种范式已经发生了变化,帮助解释模型决策的策略在表格和数字之外的重要性正在增加。在这一趋势中,可视化技术被广泛用于支持分类模型的可解释性,其中主要关注基于规则的技术。尽管取得了这些进展,但现有方法在视觉可扩展性方面存在局限性,而且大型和复杂模型的可视化(如随机森林(RF)技术产生的模型)仍然是一个挑战。在本文中,我们提出了可解释矩阵(ExMatrix),这是一种新颖的RF可解释可视化方法,可以处理具有大量规则的模型。它采用了一种简单而强大的矩阵式视觉隐喻,其中行是规则,列是特性,单元格是规则谓词,从而支持对整个模型的分析和审计分类结果。

37.DECE: Decision Explorer with Counterfactual Explanations for Machine Learning Models【机器学习模型的反事实解释决策探索者

DECE接口用于探索具有反事实解释的机器学习模型的决策。用户使用表视图(A)进行子组级分析。表头(A1)支持通过排序和过滤操作来查看表。子组列表(A2)以行为单位列出子组,并总结它们的反事实示例。用户可以交互式地创建、更新和删除子组列表。实例透镜(A3)将聚焦子组中的每个实例可视化为单个细水平线。在实例视图(B)中,用户可以自定义(B1),并在增强的并行坐标视图(B2)中检查单个实例的不同反事实示例。

 随着机器学习模型越来越多地应用于各种决策场景,人们花费了越来越多的努力使机器学习模型更加透明和可解释。在各种解释技术中,反事实解释具有人性化和可操作性的优点——反事实解释告诉用户如何在对输入进行最小更改的情况下获得所需的预测。此外,反事实解释也可以作为模型决策的有效探针。在这项工作中,我们利用反事实解释的潜力来理解和探索机器学习模型的行为。我们设计了DECE,这是一个交互式可视化系统,可以帮助理解和探索模型在个别实例和数据子集上的决策,支持从决策主体到模型开发人员的用户。

38.Visual Analysis of Class Separations with Locally Linear Segments【高维标记数据】

(上)我们的可视化分析框架的说明。(下)界面由四个主要视图组成:(A)段关系视图,(B)段详细视图,(C)投影视图,(D)路径探索视图。

 高维标记数据广泛存在于许多实际应用中,如分类和聚类。分析这类数据集的一个主要任务是探索从机器学习模型派生的类分离和类边界。降维技术通常用于支持分析师通过描述来自多个类的数据分布的低维表示来探索底层决策边界结构。然而,这种基于投影的分析是有限的,因为它们缺乏显示复杂非线性决策边界结构中的分离的能力,并可能遭受严重的失真和低可解释性。为了克服这些分离性和可解释性的问题,我们提出了一种可视化分析方法,利用线性投影的可解释性的力量来支持分析人员探索非线性分离结构。我们的方法是提取一组局部线性段,近似原来的非线性分离。与传统的基于投影的分析(将数据实例映射到单个散点图)不同,我们的方法支持通过多个局部投影结果来探索复杂的类分离。

39.A Visual Analytics Approach for Exploratory Causal Analysis: Exploration, Validation, and Applications【探索因果分析】

Causality Explorer的用户界面使用一个包含200行和24个维度的真实听力学数据集进行了演示。用户可以探索因果图,用因果图视图感知因果关系及其不确定性,用维度视图验证数据,用表格视图将因果关系应用于假设分析。

 使用因果关系来指导决策已经成为一个重要的分析任务,横跨各个领域,从市场营销和医学到教育和社会科学。虽然已经开发出了强大的统计模型来从数据推断因果关系,但领域从业者仍然缺乏有效的可视化界面来解释因果关系并将其应用于决策过程。通过对领域专家的访谈研究,我们描述了他们当前的决策工作流程、挑战和需求。通过迭代设计过程,我们开发了一个可视化工具,允许分析人员在现实世界的决策场景中探索、验证和应用因果关系。该工具提供了一个不确定性感知的因果图可视化,用于表示从高维数据推断出的大量因果关系。在因果图的基础上,它支持一组执行假设分析和制定行动计划的直观用户控制。我们报告了两个数字营销和学生建议场景的案例研究,以证明用户可以有效地探索因果关系和迭代设计行动计划,以达到他们的目标。

40.SpotSDC: Revealing the Silent Data Corruption Propagation in High-performance Computing Systems

SpotSDC帮助研究人员研究隐性数据损坏,如错误位翻转,以及这些错误如何通过程序的计算传播。如(a)所示,我们展示了位翻转对共轭梯度基准的不同程序区域的影响的分层概述,并突出了最脆弱的区域。用户可以有选择地选择一组故障注入实验,比较(b)中这些实验的故障注入输入错误与输出错误,并使用(c)监控程序执行过程中错误的传播。

随着技术的快速扩展,高性能计算(HPC)系统的硬件更容易受到随机位翻转造成的计算错误的影响。一些位翻转可能导致程序崩溃或对输出有很小的影响,但其他可能导致静默数据损坏(SDC),即未检测到但重要的输出错误。经典的故障注入分析方法在程序执行过程中采用随机位翻转的均匀抽样来导出统计弹性轮廓。然而,以足够的细节总结这样的故障注入结果是困难的,并且理解故障损坏程序的行为仍然是一个挑战。在这项工作中,我们引入了spottsdc,这是一个可视化系统,有助于分析程序对SDC的弹性。SpotSDC提供了对输出影响的不同细节级别的多个透视图,这些细节与源代码中翻转位发生的位置、翻转的位以及执行期间发生的时间有关。spottsdc还使用户能够研究代码保护,并为理解错误注入程序的行为提供新的见解。

Software Visualization

41.Vis-a-Vis: Visual Exploration of Visualization Source Code Evolution

用于系统可视化算法的开发和探索。

 为可视化原型开发算法通常涉及不同开发阶段和设计决策的直接比较,即使是微小的修改也可能极大地影响结果。虽然现有的开发工具提供了对源代码性能和结构方面的总体洞察的可视化,但它们忽略了图形算法所特有的结果图像的核心重要性。在本文中,我们提出了一种新颖的方法,通过提供自动更新的元可视化,使可视化程序员能够同时探索他们的算法在开发阶段的进化,以及相应的可视化结果。通过提供易于使用的导航和比较工具,我们的交互系统允许在可视化和源代码级别上直接比较所有的开发状态。不同图像的动态构造、源代码的差异以及源代码结构的可视化表示,进一步增强了用户对状态随时间相互关联的变化的洞察力。我们的解决方案可以通过基于web的界面访问,该界面提供了c++和GLSL代码的gpu加速实时执行,并支持用于科学可视化的特定领域编程语言。

42.Visualizing Hierarchical Performance Profiles of Parallel Codes using CallFlow【可视化并行代码】

CallFlow是一个交互式可视化分析工具,它提供了cct的高级概述,以及逐步探索cct的语义细化操作。

调用上下文树(CCTs)将性能指标与调用路径结合起来,有助于理解并行程序的执行和性能。为了确定性能瓶颈,程序员和性能分析人员可视地探索cct,形成并验证关于性能下降的假设。然而,由于并行程序的复杂性,现有的可视化表示无法扩展到运行在大量处理器上的应用程序。我们将介绍CALLFLOW,这是一个交互式可视化分析工具,它提供了cct的高级概述,以及逐步探索cct的语义细化操作。我们使用一个基于流的比喻,通过将执行时间视为调用链期间花费的资源来可视化CCT,并通过对大规模生产模拟代码的案例研究来演示我们设计的有效性。

43.Githru: visual analytics of understanding software development context through git historical metadata analysis【了解软件开发背景】

我们介绍了Githru,这是一个交互式可视化分析系统,通过对Git元数据的交互式探索,开发人员可以有效地了解开发历史的背景。我们设计了一种交互式可视化编码方式,以一种可伸缩的方式表示大型Git图,同时保留Git图中的拓扑结构。Githru提供了一个交互式摘要视图,帮助用户获得开发历史的概述,以及一个比较视图,用户可以在其中比较不同的提交集群。

 Git元数据包含丰富的信息,供开发人员了解大型软件开发项目的整体上下文。因此,它可以帮助新的开发人员、管理人员和测试人员了解开发的历史,而不需要深入研究一大堆不熟悉的源代码。然而,目前的Git可视化工具还不足以分析和探索元数据:它们主要关注于提高Git命令的可用性,而不是帮助用户理解开发历史。此外,它们不适合大型和复杂的Git提交图,而这对于理解整个开发历史非常重要。在本文中,我们介绍了一个交互式可视化分析系统Githru,它可以让开发者通过对Git元数据的交互式探索,有效地了解开发历史的背景。我们设计了一种交互式可视化编码方式,以一种可伸缩的方式表示大型Git图,同时保留Git图中的拓扑结构。为了能够对大型Git提交图进行可扩展的探索,我们提出了新的技术(图重构、聚类和上下文保持壁式合并(CSM)方法)来抽象大规模的Git提交图。基于这些Git提交图抽象技术,Githru提供了一个交互式摘要视图,帮助用户获得开发历史的概述,以及一个比较视图,用户可以在其中比较不同的提交集群。Githru的有效性已经通过与领域专家的案例研究得到了证明,这些案例研究使用了来自大型国际IT公司大型软件开发团队的真实的内部数据集。

44.A Visual Analytics Approach to Debugging Cooperative, Autonomous Multi-Robot System【协作自主多机器人系统的调试,领域扩展介绍,与NASA合作】

多机器人系统中的意外行为通常是由机器人世界观的不对称引起的,即每个机器人对自身状态和其他机器人假定状态的内部表示。MOSAIC Viewer是一种视觉分析工具,可以帮助操作人员(i)理解机器人的日程安排,(ii)检测并进行机器人不同步世界观的根本原因分析,设计用于MOSAIC多智能体分布式调度框架。我们发现,与当前的方法相比,可视化和交互使去同步的检测和分析变得更快、更容易。

自主多机器人系统(Autonomous multi-robot systems)是指一组机器人共享信息,以执行单个机器人无法完成的任务。该系统在许多领域都有很大的应用前景,比如行星探索任务。在使用共享世界协调范式的多机器人系统中,每个机器人使用其世界观(机器人对自身状态和其他机器人状态的信念的内部表示)自主地安排哪个机器人应该执行给定的任务以及何时执行任务。操作人员面临的一个关键问题是,机器人的世界观可能会不同步(通常是由于通信链接薄弱),导致机器人的调度决策不同步和不一致的紧急行为(例如,任务没有执行,或由多个机器人执行)。操作人员面临着一项耗时且困难的任务,即理解机器人的调度决策,检测不同步,并通过比较每个机器人的世界观来确定原因。为了应对这些挑战,我们引入了MOSAIC Viewer,这是一种视觉分析系统,可以帮助操作人员(i)了解机器人的日程安排,(ii)检测并进行机器人不同步世界观的根本原因分析。在与NASA喷气推进实验室的机器人专家合作的一年多时间里,我们进行了一项形成性研究,以确定必要的系统设计要求,并与12名机器人专家进行定性评估。

45.CcNav: Understanding Compiler Optimizations in Binary Code【二进制代码,编译器优化】

程序开发人员花费大量时间优化和调优应用程序。在这个迭代过程中,他们修改程序并分析产生的二进制代码。但是,使用二进制代码来理解应用了哪些编译器优化以及如何改进它是具有挑战性的。我们展示了我们的可视化分析系统——编译导航(CcNav)——设计用于识别和评估二进制代码中的编译器优化。

程序开发人员花费大量时间优化和调优程序。在这个迭代过程中,他们应用优化,分析结果代码,并修改编译,直到满意为止。理解编译器对代码做了什么是这个过程的关键,但这是非常耗时和劳动密集型的。用户需要浏览数千行二进制代码,并将其与源代码概念关联起来,以理解编译的结果并确定优化。我们与程序开发人员和性能分析人员合作,提出了一项设计研究。我们的合作者处理与程序相关的各种工件,如二进制代码、源代码、控制流图和调用图。通过访谈、反馈和配对分析,我们分析了他们的任务和工作流程。在此任务分析的基础上,通过以人为中心的设计过程,我们设计了一个可视化分析系统编译导航(编译导航),以帮助探索编译器优化对程序的影响。CcNav提供了一个流线化的工作流和一个集成了不同工件的统一上下文。CcNav支持跨所有构件的一致交互,使得将二进制代码与源代码概念关联起来变得很容易。CcNav使用户能够导航和过滤大型二进制代码,以识别和总结优化,如内联、矢量化、循环展开和代码提升。

46.ShuttleSpace: Exploring and Analyzing Movement Trajectory in Immersive Visualization【探索和分析沉浸式可视化中的运动轨迹,体育数据的沉浸式分析】

ShuttleSpace是一个沉浸式分析系统,允许羽毛球教练从球员的角度分析轨迹数据。a)在全尺寸模拟羽毛球场上对轨迹进行可视化。在用户视野(FOV)的左右两侧分别显示两个半甜甜圈图,分别表示轨迹的使用率和胜率。b)两个基于网格的可视化显示沿垂直位置的使用率和胜率分布。c)比较两类轨迹的使用和胜率。

 我们提出了ShuttleSpace,一个沉浸式分析系统,以协助专家分析羽毛球运动轨迹数据。运动中的轨迹,如球员和球的运动,包含了丰富的球员行为信息,因此被教练和分析人员广泛分析,以提高球员的表现。然而,现有的视觉分析系统通常会在球场图中呈现现实的轨迹,从而导致专家难以想象球场上的情况并理解玩家为何会采取某种行动。随着虚拟现实(VR)等沉浸式技术的发展,专家们逐渐有机会从玩家的角度来观察、感受、探索和理解这些3D轨迹。然而,很少有研究从这样的角度来研究如何支持体育数据的沉浸式分析。

Supporting Experts

47.QLens: Visual Analytics of Multi-step Problem-solving Behaviors for Improving Question Design【在线教育、多步问题、问题解决过程】

 QLens可以让问题设计师分析学生的多步骤问题解决行为,从细节层面进行设计改进。

近年来,随着在线教育的快速发展,越来越多的学习平台为学生提供多步问题,以培养他们解决问题的能力。为了保证这类学习材料的高质量,问题设计者需要检查学生的问题解决过程是如何一步步展开的,从而推断学生的问题解决逻辑是否符合他们的设计意图。他们还需要比较不同群体(例如,不同年级的学生)的行为,把问题分发给知识水平合适的学生。细粒度交互数据的可用性,例如在线平台上的鼠标移动轨迹,为分析解决问题的行为提供了机会。然而,对高维问题序列数据的解释、总结和比较仍然具有挑战性。在本文中,我们提出了一个视觉分析系统,QLens,以帮助问题设计师检查详细的解决问题的轨迹,比较不同的学生群体,提取设计改进的见解。特别的是,QLens将问题解决行为建模为一个混合状态转换图,并通过一个新的嵌入字形的桑基图来可视化它,它反映了学生解决问题的逻辑性、参与性和遇到的困难。

48.Visilant: Visual Support for the Exploration and Analytical Process Tracking in Criminal Investigations【刑事调查、犯罪学家、支持调查工作流程,领域扩展介绍】

可视化研究人员,刑事调查人员

 刑事调查人员的日常工作包括对高度复杂和异构的犯罪案件数据进行深入分析。这些数据可以包括案件描述、证词、犯罪网络、时空信息以及几乎与案件有关的任何其他数据。刑事调查人员在巨大的时间压力下工作,分析关系数据,提出和验证几个假设,并得出最终的结论,而数据可能是不完整或不一致的,并在调查过程中被更改和更新,因为有新的发现添加到案件中。基于与犯罪学家为期四年的紧密合作,我们提出了一种支持调查工作流程的可视化工具的概念设计,以及Visilant,一种基于该设计的基于网络的工具,用于探索和分析犯罪数据。Visilant旨在支持调查管道中的探索部分,从案例概述,通过探索和假设的产生,到案例展示。Visilant跟踪推理过程,当数据变化时,它会告知调查人员哪些假设会受到数据变化的影响,需要修改。

49.ChemVA: Interactive Visual Analysis of Chemical Compound Similarity in Virtual Screening【领域扩展、化学】

 ChemVA的可视化界面,一个用于交互式可视化探索大的化合物及其性质的工具。ChemVA由几个相互关联的视图组成,展示了六边形视图中的降维结果,以及我们新提出的Difference视图中投影的比较。这些与带有额外分子性质的表视图和说明所选化合物的空间组织和排列的3D视图一起显示。

在现代药物发现过程中,药物化学家要处理候选分子大集合分析的复杂性。计算工具,如降维(DR)和分类,是常用的有效处理特征的多维空间。这些潜在的计算往往会阻碍结果的可解释性,并阻止专家评估单个分子特征对结果表征的影响。为了提供一个解决方案来仔细检查这样复杂的数据,我们引入了ChemVA,一个用于视觉探索大分子系综及其特征的交互式应用程序。我们的工具包括多个协同视图:六角形视图、细节视图、3D视图、表格视图,以及新提出的用于DR投影比较的Difference视图。这些视图显示DR投影与生物活性、选定的分子特征以及每个投影的置信度。这种视图的结合允许用户向下钻取数据集,并有效地选择候选化合物。

50.A Visualization Framework for Multi-scale Coherent Structures in Taylor-Couette Turbulence【领域扩展应用,流体力学,无力掺和】

Taylor-Couette turbulent flow(TCF)是两个同轴、独立旋转的圆柱体之间的流体运动。TCF是流体动力学中一个重要的模型系统,它有助于理解水动力稳定性的发展和模式的形成。为了支持领域专家对TCF的分析,我们提出了第一个3D可视化框架,该框架能够清晰地分离TCF的大尺度和小尺度相干结构。该方法成功揭示了传统方法难以实现的不同控制参数下TCF的三维大尺度相干结构。

 Taylor-Couette flow (TCF)是在两个同心独立旋转的圆柱体之间产生的湍流流体运动。由于在流动中所表现出的各种非线性动力学现象,它在流体力学中得到了广泛的研究。由于TCF中有许多密集的相干结构相互重叠,将它们隔离和可视化具有挑战性,特别是当柱体旋转比发生变化时。以往研究TCF的方法由于简单,只能依靠二维截面来研究TCF,无法提供完整的TCF信息。与此同时,标准的可视化技术,例如某些属性的体绘制/等表面和积分曲线/表面的放置,通常会产生混乱的可视化。为了解决这一挑战,并支持领域专家分析TCF,我们开发了一个可视化框架,将大规模结构从密集、小规模结构中分离出来,并提供这些结构的有效可视化表示。我们采用特征水平集方法来组合多个属性,并将它们作为一个过滤器来分离大尺度和小尺度结构,而不是使用单一的物理属性作为标准方法来有效地分离TCF中不同尺度的结构。为了将这些结构可视化,我们将等值面提取应用于特征水平集产生的距离场的核密度估计。

51.Conceptual Model of Visual Analytics for Hands-on Cybersecurity Training【网络安全培训-领域扩展】

实践培训是实践网络安全理论概念和提高参与者技能的有效方法。在本文中,我们讨论了可视分析原则在培训课程的设计、执行和评估中的应用。我们提出了一个使用视觉分析的概念模型,该模型支持在培训生命周期的各个阶段中涉及的用户的意义表达活动。该模型源自我们在设计和组织各种网络安全培训课程方面的长期经验。它提供了可视化的分类,并可用于开发新的可视化工具的框架,支持培训生命周期的各个阶段。

time

52.A Visual Analytics Framework for Reviewing Multivariate Time-Series Data with Dimensionality Reduction【将时间相关的多元数据作为一个整体】

 MulTiDR可视化界面的截图。在这里,我们对法国马赛的高中生动态联系网络进行分析。

在许多实际应用中,数据驱动问题的解决涉及到对时间相关的多元数据的分析,其中降维(DR)方法经常被用来揭示数据的内在结构和特征。然而,DR通常应用于单时间点多变量或单变量时间序列的数据子集,这导致需要手动检查不同数据子集的DR结果并将其关联起来。当维度的数量在时间点或属性数量方面很大时,这个手动任务就会变得过于乏味和不可行的。在本文中,我们提出了一种新的DR框架MulTiDR,该框架可以将时间相关的多元数据作为一个整体进行处理,从而提供数据的全面概述。在这个框架中,我们分两步使用DR。当将数据的实例、时间点和属性作为一个3D数组处理时,第一个DR步骤将数组的三个轴减少为两个,第二个DR步骤将数据在低维空间中可视化。此外,通过结合对比学习方法和交互式可视化,我们的框架增强了分析师解释DR结果的能力。

53.Co-Bridges: Pair-wise Visual Connection and Comparison for Multi-item Data Streams【自然隐喻的扩展使用,桥与河流】

为了比较涉及多个项目的数据流(例如,文本中的文字、动作序列中的演员或动作类型、行程中的到访地点等),我们提出了Co-Bridges,这是一种涉及连接和比较技术的视觉设计,可以揭示两个数据流之间的相似性和差异性。联合桥使用河和桥的比喻,河的两边代表数据流,连接数据流的时间或顺序对齐的片段。这些部分在涉及各种项目方面的共性和差异在桥梁上显示出来。

在各个领域中,存在着丰富的各种类型的多项数据流或序列,如新闻和社交媒体文本流、基因序列和体育赛事等。在数据分析中,比较是一项重要而又通用的任务。为了比较涉及多个项目的数据流(例如,文本中的文字、动作序列中的演员或动作类型、行程中的到访地点等),我们提出了Co-Bridges,这是一种涉及连接和比较技术的视觉设计,可以揭示两个数据流之间的相似性和差异性。联合桥使用河和桥的比喻,河的两边代表数据流,桥连接数据流的时间或顺序对齐的片段。这些部分在涉及各种项目方面的共性和差异在桥梁上显示出来。交互式查询工具支持选择特定的流子集进行集中的查询。可视化支持定性的(常见的和不同的项目)和定量的(流量,项目参与的数量)比较。

54.MultiSegVA: Using Visual Analytics to Segment Biologging Time Series on Multiple Scales【在多尺度上分割生物时间序列】

 我们提出了我们的多窗口网络平台MultiSegVA,在多个尺度上轻松分割生物日志时间序列。我们为多尺度时间序列分割提供了量身定制的可视化交互特性、一种新的可视化查询语言和一组面向领域的技术,这些技术将被VQL使用。

在多个时间尺度上分割动物的生物记录时间序列是一个必要的步骤,需要复杂的技术和谨慎的参数化和可能的跨领域专业知识。然而,目前还缺乏支持这种多尺度分割的视觉交互工具。为了缩小这一差距,我们提出了我们的MultiSegVA平台,在多个时间尺度交互式地定义分割技术和参数。MultiSegVA主要为在多个尺度上分割未标记的时间序列提供量身定制的视觉交互手段和视觉分析范式。此外,为了灵活组合多尺度分割,该平台贡献了一种新的可视化查询语言,将多种分割技术联系起来。为了说明我们的方法,我们提出了一组面向领域的分割技术派生与运动生态学家的合作。我们在两个现实世界的用例中展示了MultiSegVA的适用性和有用性,分别来自运动生态学、环境感知分割和渐进聚类后的行为分析。

55.MineTime Insight: Visualizing Meeting Habits to Promote Informed Scheduling Decisions【日历应用程序扩展,可视化会议习惯促进明智的日程安排决策,领域扩展也可以der

一个日历应用程序扩展,以促进知情的会议安排决定。

公司会议是商业活动的重要组成部分。尽管大量的学术论文研究了如何使会议的安排过程更快甚至自动化,但很少有工作来促进关于会议时间是如何花费的回顾性推理。传统的日历应用程序不允许用户提取可操作的统计数据,尽管有研究表明,面向反射reflection-oriented的设计可以增加用户对其习惯的理解,从而鼓励向更好的实践转变。在本文中,我们提出了MineTime Insight,这是一个由多个协调视图组成的工具,用于探索个人日历数据,其总体目标是改善短期和长期的日程安排决策。尽管我们关注的是工作环境,但我们的工作建立在个人视觉分析领域的最新成果之上,因为它的目标用户不一定是可视化和数据分析方面的专家。

56.SineStream: Improving the Readability of Streamgraphs by Minimizing Sine Illusion Effects【通过最小化正弦错觉效果来提高流图的可读性,注意正弦错觉这个词

 SineStream通过调整每一层的正交和垂直方向,最大限度地减少由强斜坡引起的正弦错觉效果,并提高流图的可读性。我们展示了COVID数据集[23](上)和Bank Interest数据集[30](下)的结果。出现正弦错觉是因为人眼无法准确估计斜率相似的两条曲线之间的垂直距离。正如上面的箭头所示,我们的方法(A3, B3)比之前的Byron & Wattenberg([4])和Bartolomeo & Hu (B1)的作品更好地反映了层的真实厚度(A2, B2)。

在本文中,我们提出了一种新的流图变体SineStream,它通过最小化正弦错觉效果来提高可读性。这种影响反映了人们倾向于以两条曲线之间的正交距离而不是垂直距离作为他们的距离。在SineStream中,我们将流图的可读性与最小化正弦错觉联系起来,并通过这样做为它们的设计提供一个感知基础。

57.SplitStreams: A Visual Metaphor for Evolving Hierarchies【河流隐喻扩展,tree maps and nested streamgraphs,重点关注,自然隐喻扩展

显示树型数据结构随时间演变的可视化。我们突出显示每个时间点的层次结构,以及从一个时间步到下一个时间步的变化。

 随着时间的推移,分层结构化数据的可视化是一个持续的挑战,有几种方法试图解决它。诸如动画或并列树可视化等技术不能提供时间序列的良好概述,并且在传达随时间变化方面缺乏表现力。嵌套流图提供了对数据演变的更好理解,但缺乏给定时间步的层次结构的清晰轮廓。此外,这些方法通常局限于静态层次结构或排除数据中复杂的层次结构变化,从而限制了它们的用例。我们提出了一种新颖的视觉隐喻,能够提供随时间推移的所有层次变化的静态概述,并清晰地勾勒出每个时间步的层次结构。我们的方法允许树映射和嵌套流图之间的平滑转换,允许探索动态行为和层次结构之间的权衡。

Molecules, Cells, & Vessels

58.HyperLabels: Browsing of Dense and Hierarchical Molecular 3D Models【层次-分子-3D模型,领域扩展】

我们提出了一种新的导航方法,允许浏览复杂的和分层的3D模型。在这里,通过点击活动文本标签(HyperLabels),可以浏览嵌入血浆中的艾滋病毒颗粒模型。

 我们提出了一种浏览分层三维模型的方法,在这种方法中,我们将二维环境中典型的分层结构导航(使用单击节点、链接或图标)与三维空间数据可视化相结合。我们的方法的动机是大型分子模型,传统的单尺度导航隐喻是不适合的。多尺度现象,如天文或地理,由于其庞大的数据空间和多层次的组织,是复杂的导航。此外,结构生物学的模型在空间和规模上也非常密集。需要用切面来显示各个模型子部件。摄像机必须支持对整个病毒水平的研究,以及对小分子水平的研究。我们通过使用HyperLabels来解决这些挑战:活动标签——除了它们的注释角色——也支持用户交互。单击HyperLabels选择下一个要探索的结构。然后,我们调整可视化来展示所选子部分的内部组成,并使进一步的探索成为可能。最后,我们使用面包屑面板来定位,并作为一种向上遍历模型层次结构的机制。

59.Visual cohort comparison for spatial single-cell omics-data【空间单细胞组学数据的视觉队列比较,邻域扩展

我们集成系统的截图,包括基于细胞丰度的对比视图(使用雨云图),组织视图(显示两个队列的选定样本),以及使用差异热图和雨云图的多细胞微环境对比视图。

 空间分辨组学数据使研究人员能够精确区分组织中的细胞类型,并探索它们的空间相互作用,从而深入了解组织的功能。为了了解疾病的病因或恶化并确定相关的生物标志物,临床研究人员定期进行大规模队列研究,需要在细胞水平上对这些数据进行比较。在这样的研究中,由于对数据的预期知之甚少,探索性数据分析是必要的。在此,我们提出了一个交互式可视分析工作流,用于比较空间分辨组学数据的队列。我们的工作流程允许基于多个细节层次对两个队列进行比较分析,从包含的细胞类型的简单丰度到复杂的共同定位模式,再到完整组织图像的个体比较。因此,该工作流能够在工作流的任何阶段识别出区分队列的特征,以及离群样本。

60.Improving the Usability of Virtual Reality Neuron Tracing with Topological Elements【虚拟现实神经元跟踪,半自动,使用拓扑特征追踪神经元】

 从左到右:从Morse-Smale complex(MSC)中提取脊状结构的连通图,其中包含数据中可能的神经元片段的超集。我们的msc引导半自动跟踪工具允许用户快速跟踪路径,并在跟踪时查看实时预览(橙色线)。当对痕迹满意时,可以将其添加到重建(白线)。

连接组学领域的研究人员正在努力重建大脑中的神经连接图,以便从根本上理解大脑是如何处理信息的。构建接线图是通过荧光显微镜成像技术获得的高分辨率图像堆栈来跟踪神经元。虽然已经提出了大量的自动跟踪算法,但这些算法往往依赖于数据中的局部特征,在有噪声的数据或模糊的情况下失败,需要耗时的人工纠正。因此,手动和半自动跟踪方法仍然是创建精确的神经元重建的最先进的方法。我们提出了一种新的半自动方法,使用拓扑特征来引导用户跟踪神经元,并将该方法集成到以前用于手动跟踪的虚拟现实(VR)框架中。我们的方法增强了拓扑元素的可视化和交互,允许快速理解和跟踪复杂的形态。

61.CMed: Crowd Analytics for Medical Imaging Data【用于探索从众包中获得的医学图像数据注释

 CMed是一个可视分析框架,用于探索从众包中获得的医学图像数据注释。CMed可以用于基于许多不同的指标(如检测率、记录的事件和注释的聚类)来可视化、分类和过滤众包临床数据。CMed提供了几个交互式的链接可视化组件来分析特定视频和相关工作者的人群注释结果。此外,在我们的CMed框架中,可以使用多个链接视图来检查单个worker的所有结果。

我们提出了一个可视化分析框架CMed,用于探索从众包中获得的医学图像数据注释。CMed可以用于基于许多不同的指标(如检测率、记录的事件和注释的聚类)来可视化、分类和过滤众包临床数据。CMed提供了几个交互式的链接可视化组件来分析特定视频和相关工作者的人群注释结果。此外,在我们的CMed框架中,可以使用多个链接视图来检查单个worker的所有结果。我们允许众包应用分析师观察模式,并收集对众包医疗数据的见解,帮助他/她设计未来的众包应用,以实现工人的最佳产出。

62.Void Space Surfaces to Convey Depth in Vessel Visualizations

 血管结构可视化的例子使用我们的技术,虚空空间表面。我们的技术利用了容器之间的空白空间,并在容器之间插入不同深度线索,如dark-mean -deep(左),pseudo-chromadepth(中),chromadepth(右),或高级照明技术和等线(所有图形)。此外,由于深度线索已经从血管表面转移,额外的信息可以编码在它们上面。

为了增强深度感知和数据理解,通常在复杂血管结构的3D可视化中使用额外的深度线索。文献中描述了各种不同的方法,从超过景深的色深颜色编码到基于符号的编码。不幸的是,大多数现有的方法都面临着同样的问题:由于这些线索直接应用于几何表面,在血管壁上显示额外的信息,如其他模式或衍生属性,受到了损害。为了克服这一限制,我们提出了利用容器分支之间的空白空间来交流深度和它们的相对位置的Void Space Surfaces。这使得我们能够在不干扰空间数据和可能叠加的参数信息的情况下增强血管结构的深度感知。本文介绍了虚空空间曲面,描述了它们的技术实现,并展示了它们在各种容器树中的应用。

Dynamic Graphs & Hypergraphs

63. A Visual Analytics Approach for Ecosystem Dynamics based on Empirical Dynamic Modeling【经验动态建模(EDM)

 用经验动态建模(EDM)研究非线性交互作用的视觉分析原理图。首先利用(A)实测时间序列数据和(B)利用EDM技术提取的相互作用系数构建相互作用系数变化的动态图。(C)我们提出的可视化分析系统能够使用降维和刷联可视化技术检测和解释系统状态。(D)利用标注和总结的过程,可以得到状态转移图进行解释。

跨许多学科的科学探究的一个重要方法包括使用观测的时间序列数据来理解关键变量之间的关系,以获得对控制给定系统的基本规则的机械洞察力。在真实的系统中,如生态系统,时间序列变量之间的关系通常不是静态的;相反,这些关系是动态的,并以非线性或状态依赖的方式变化。为了进一步理解这样的系统,我们研究了适当地描述这些动态特性的方法(即,当它们随时变系统状态变化时测量交互的方法),以及可以帮助分析系统行为的可视化技术。在这里,我们专注于经验动态建模(EDM)作为一种先进的方法,具体确定因果变量和衡量时间序列变量之间不断变化的状态依赖关系。EDM是一种基于动态吸引子研究系统的无方程方法,而不是以参数方程为中心的方法。我们提出了一个视觉分析系统,以支持识别和机械解释系统状态使用电火花构建的动态图。这项工作在四个分析任务中进行了详细说明,并通过GUI进行了演示,提供了一种EDM和可视化技术(如刷链可视化和可视化摘要)的新综合,以解释代表生态系统动态的动态图。

64.Multiscale Snapshots: Visual Analysis of Temporal Summaries in Dynamic Graphs【动态图,时序总结】

 我们提出了多尺度快照,一个可视化的分析方法来分析动态图的时间摘要在多个时间尺度。我们(1)递归地创建不同时间尺度(时间粒度)的图的时间摘要(快照);(2)然后我们应用一种无监督图学习方法(图嵌入)来学习快照的低维表示;然后,我们(3)给出了一个探索性的可视化,将不同时间粒度的快照组织在一个层次中,以提供一个演进的结构特性的概述,该结构特性利用图嵌入用于分析任务(如相似性搜索)。

综述驱动的大规模动态图可视化分析是一个重大的挑战。我们提出了Multiscale Snapshots,一个可视化的分析方法来分析动态图的时间摘要在多个时间尺度。首先,我们递归地生成时间摘要,将重叠的图序列抽象成紧凑的快照。其次,我们将图嵌入应用于快照,以学习每个图序列的低维表示,以加快特定的分析任务(例如,相似性搜索)。第三,我们将从粗粒度快照到细粒度快照的数据可视化,以半自动分析时间状态、趋势和异常值。该方法使我们能够发现类似的时间摘要(例如,重复发生的状态),减少时间数据以加快自动分析,并探索动态图的结构和时间属性。

65. The Effectiveness of Interactive Visualization Techniques for Time Navigation of Dynamic Graphs on Large Displays【interactive timeslicing方法在比较较远的时间点时更好

 我们在实验中测试的接口

动态网络在视觉上分析是很有挑战性的,特别是当它们跨越一个大的时间范围,在此期间新的节点和边可能出现和消失。虽然可以直接提供同时(例如,通过小倍数)或交互(例如,通过交互式动画)表示网络的多个状态(即多个时间片)的可视化接口,但这些接口可能不支持需要比较不相交的时间片的任务。由于这些任务是理解网络动态方面的关键,因此了解哪些交互式可视化最能支持这些任务是很重要的。我们展示了一系列实验室实验的结果,比较了两种传统方法(小倍数和交互式动画)和一种基于交互式时间切片的最新方法。这些任务通过触摸屏在一个大屏幕上完成。结果表明,交互式时间切片法在比较较远的时间点时效果较好,但在分析相邻时间间隔时效果较差。

66. Staged Animation Strategies for Online DynamicNetworks【在线动态网络】【探索了三种策略来为在线动态网络设置动画:基于时间的、基于事件的,以及通过结合前两者的优势引入的一种新的混合方法

 渲染在线动态网络——未来状态未知的网络——需要在时效性和清晰度之间取得平衡。渲染必须监视任务,以便动画不会落后于新事件太远,并尽量减少可能阻碍理解的同时变化。我们探索了在线动态网络阶段动画的三种策略:基于时间的、基于事件的,以及我们通过结合前两种优势引入的一种新的混合方法。我们与专家进行了用户研究和后续有声思考研究,并讨论了我们的发现。

动态网络——随时间变化的网络可以分为两类:离线动态网络(网络的所有状态都是已知的)和在线动态网络(网络的过去状态是已知的)。在动态网络中进行动画转换的研究更多地集中在离线数据上,其中渲染策略可以考虑到网络的过去和未来状态。渲染在线动态网络是一个更具挑战性的问题,因为它需要在监测任务的时效性(以便动画不会落后于事件太多)和理解任务的清晰度之间取得平衡,以尽量减少可能难以跟踪的同时变化。为了说明这些需求所带来的挑战,我们探索了三种策略来为在线动态网络设置动画:基于时间的、基于事件的,以及我们通过结合前两者的优势引入的一种新的混合方法。我们阐述了每种策略在表示低吞吐量和高吞吐量数据方面的优点和缺点,并进行了一项用户研究,包括对动态网络的监测和理解。我们还与动态网络可视化领域的专家进行了监测与理解相结合的跟踪、有声研究。我们的研究结果表明,强调理解的动画阶段策略在参与者的反应时间和准确性方面做得更好。

67.Analyzing Dynamic Hypergraphs with Parallel Aggregated Ordered Hypergraph Visualization

历史学家从59份法律文件中提取的数据集的并行聚合有序超图可视化:时间从左到右运行,离散时间槽代表当时的网络。顶点(这里的人)用平行的水平条表示,所有的名字都在左边对齐。每条平行线都是一条超边,连接两个或多个顶点。每个连接都用一个点标记。在这个视图中,一度的顶点(即单个文档中涉及的人)已经从顶点列表中隐藏了起来,它们的存在只能用点滴来暗示,即在超边缘的下端有更小的灰点。

Parallel Aggregated Ordered Hypergraph (PAOH) 并行聚合有序超图,是一种动态超图可视化的新技术。超图是图的一种推广,其中边可以连接多个顶点。hypergraph可以用于对商业合作伙伴网络或每篇文章有多个作者的合作网络建模。动态超图在离散的时隙中演化。PAOH将顶点表示为平行的水平条,将超边表示为垂直线,使用点来描绘与一个或多个顶点的连接。我们描述了并行聚合有序超图的原型实现,报告了一项由9名参与者参与的可用性研究,分析了发布数据,并总结了所做的改进。

68.Visual Analytics for Temporal Hypergraph Model Exploration

超矩阵,一种新颖的方法来探索和完善时序超图模型使用视觉分析。交互式的基于多层矩阵的可视化(A)实现了对模型的检查,以及上层界面(B)。主要区域显示了用于刑事调查中模糊现实数据集的第二个语义缩放级别,而五个插图(C)显示了用于探索的其他深入级别。该技术允许交互式(D)贡献领域知识,由此产生的影响对整个机器学习模型产生连锁反应,从而细化它。

从生物学中的基因相互作用到计算机网络再到社交媒体,许多过程都可以被更精确地建模为时间超图,而不是规则图。这是因为超图通过扩展边来概括图,以连接任意数量的顶点,允许更准确地描述复杂的关系,并预测它们随着时间的推移的行为。然而,这种基于超图的预测模型的交互探索和无缝细化仍然是一个主要的挑战。我们贡献了Hyper-Matrix,一种新颖的视觉分析技术,通过机器学习和交互式可视化之间的紧密耦合来解决这一挑战。特别是,该技术将一个几何深度学习模型作为问题特定模型的蓝图,同时将基于图和基于类别的数据的可视化与一种新的交互组合集成在一起,以有效的用户驱动的超图模型探索。为了消除上下文切换和确保可伸缩性,我们基于矩阵的可视化提供了跨多层语义缩放的下钻功能,从模型预测的概述到内容。我们基于交互式用户导向过滤和搜索任务,动态修改分区层次结构,各种矩阵重新排序技术,以及交互式模型反馈,促进了相关连接和组的重点分析。

Neural Networks

69.CNNPruner: Pruning Convolutional Neural Networks with Visual Analytics【CNN模型剪枝】

 CNNPruner: (a) Tree视图帮助跟踪不同的修剪计划;(b) Statistics视图提供模型批评统计信息,以监控修剪后的模型;(c)“模型”视图可让使用者以互动的方式,从不同的准则获得有份量的视觉提示进行修剪;(d)“筛选器”视图显示个别筛选器的详细资料,供使用者调查及以互动方式修剪。

Convolutional neural networks (CNNs)在许多计算机视觉任务中表现出色。然而,CNN模型的尺寸越来越大,使得它们无法被广泛部署到计算资源有限的设备上,例如移动/嵌入式设备。模型剪枝这一新兴课题致力于解决这一问题,方法是去除不太重要的神经元,并对剪枝后的网络进行微调,以最大限度地减少精度损失。然而,现有的自动剪枝解决方案往往依赖于剪枝重要性标准的数值阈值,缺乏在效率和准确性之间实现最佳平衡的灵活性。此外,神经元剪枝和模型微调阶段之间复杂的相互作用使得这一过程不透明,因此难以优化。在本文中,我们通过一种名为CNNPruner的可视化分析方法来解决这些挑战。它通过不稳定性和敏感性来考虑卷积滤波器的重要性,并允许用户根据模型大小或精度的期望目标交互式地创建修剪计划。此外,CNNPruner集成了最先进的过滤器可视化技术,以帮助用户理解不同过滤器发挥的作用,并完善他们的修剪计划。

70.Visual Neural Decomposition to Explain Multivariate Data Sets【基于神经网络,研究多维数据集中变量之间的关系

研究多维数据集中变量之间的关系是数据分析师和工程师的一项常见任务。然而,随着自变量数量的增加,这个过程可能会变得繁琐和耗时,因为需要探索许多可能的组合。我们提出了一种新颖的方法来可视化输入变量和目标输出变量之间的相关性,该相关性可扩展到数百个变量。我们开发了一个基于神经网络的可视化模型,可以以一种引导的方式来探索,以帮助分析师发现和理解这种相关性。

研究多维数据集中变量之间的关系是数据分析师和工程师的一项常见任务。更具体地说,理解哪些输入变量的哪些范围导致给定目标变量的特定值通常是有价值的。不幸的是,随着自变量数量的增加,这个过程可能会变得繁琐和耗时,因为需要探索许多可能的组合。在本文中,我们提出了一种新的方法来可视化输入变量和目标输出变量之间的相关性,该相关性可扩展到数百个变量。我们开发了一个基于神经网络的可视化模型,可以以一种引导的方式来探索,以帮助分析师发现和理解这种相关性。首先,我们训练一个神经网络,从输入变量预测目标。

71.A Visual Analytics Framework for Explaining and Diagnosing Transfer Learning Processes【用于多层次探索训练深度神经网络时的迁移学习过程

可视化界面由四部分组成:(A)统计信息摘要,(B)实例视图,(C)网络关系视图,(D)特征视图。对于Office-31数据集,(1)目标模型对源数据集的预测精度低于源模型;(2)对于目标数据集,“file_cabinet”和“phone”等类在源模型和目标模型之间存在较大的性能差距;(3)给出了神经元相似度矩阵和权值;(4)部分神经元具有较高的区域分辨能力,而第5层神经元#173具有区域不变性。

许多统计学习模型假设训练数据和未来未标记数据来自相同的分布。然而,这种假设在现实场景中很难实现,并且在重用来自类似应用程序域的现有标签时造成了障碍。迁移学习旨在通过建模领域之间的关系来放松这一假设,通常应用于深度学习应用,以减少对标记数据和训练时间的需求。尽管最近在利用视觉分析工具探索深度学习模型方面取得了进展,但很少有工作探讨解释和诊断深度学习模型之间的知识转移过程的问题。在这篇论文中,我们提出了一个视觉分析框架,用于多层次探索训练深度神经网络时的迁移学习过程。我们的框架建立了一个多方面的设计,以解释训练深度神经网络时,如何从现有模型学习到的知识转移到新的学习任务。基于全面的需求和任务分析,我们从统计、实例、特征和模型结构级别对模型行为进行了详细的检查和性能度量,并采用了描述性可视化。

72.CNN Explainer: Learning Convolutional Neural Networks with Interactive Visualization【非专业人士可以直观地检查卷积神经网络(CNNs)如何将输入图像转换为分类预测

 通过CNN解释器,学习者可以直观地检查卷积神经网络(CNNs)如何将输入图像转换为分类预测(例如,预测咖啡杯的图像),并交互式地学习其潜在的数学操作。在这个例子中,学习者使用CNN Explainer来理解卷积层如何通过三个紧密集成的视图工作,每个解释卷积的过程中增加的细节级别。

深度学习的巨大成功激发了许多从业者和学生学习这一令人兴奋的技术。然而,由于理解和应用深度学习的复杂性,对于初学者来说,迈出第一步往往是具有挑战性的。我们介绍了CNN Explainer,一个交互式可视化工具,用于非专业人士学习和检查卷积神经网络(CNN),一个基本的深度学习模型架构。我们的工具解决了新手在学习cnn时面临的关键挑战,这是我们从教师的采访和对过去学生的调查中确定的。CNN解释紧密集成了一个模型概述,总结了CNN的结构,并按需,动态可视化解释视图,帮助用户理解CNN的底层组件。通过跨越抽象级别的平滑转换,我们的工具使用户能够检查低级数学操作和高级模型结构之间的相互作用。

73.HyperTendril: Visual Analytics for User-Driven Hyperparameter Optimization of Deep Neural Networks【深度神经网络用户驱动超参数优化的可视分析支持在模型不可知的环境中用户驱动的超参数调整过程

支持用户驱动的AutoML进程的HyperTendril概述。这个例子涉及到ResNet架构中的三个超参数,例如层数、学习率和权重衰减,使用贝叶斯优化和超波段(BOHB)搜索方法。(C)搜索空间概览,(D)模型分析视图,(E1)探索概览组件显示了(B2)选择的实验面板中选择的模型细节。权重衰减超参数在(C)搜索空间概览中被激活,其有效范围在平行坐标中被突出显示。

为了减轻人工调整深度神经网络超参数的痛苦,自动化机器学习(AutoML)方法被开发用于在大组合搜索空间中搜索最优超参数集。然而,AutoML方法的搜索结果受到初始配置的显著影响,为它们找到合适的配置是一项艰巨的任务。因此,通过视觉分析方法的人工干预在这项任务中具有巨大的潜力。为此,我们提出了一种基于web的可视化分析系统HyperTendril,该系统支持在模型不可知的环境中用户驱动的超参数调整过程。hypertension drill利用一种新颖的方法,通过迭代、交互的调整过程来有效地指导超参数优化(HyperOpt),用户可以根据自己对给定结果的见解来细化搜索空间和AutoML方法的配置。

74.Analyzing the Noise Robustness of Deep Neural Networks

对抗性的例子是通过在正常的例子中加入微小但有意察觉不到的扰动而产生的,它会误导深度神经网络(DNNs)做出错误的预测。尽管在对抗性攻击和防御方面已经做了大量的工作,但对对抗性例子的精细理解仍然缺乏。为了解决这个问题,我们提出了一个可视化的分析方法来解释为什么对抗性例子被错误分类。关键是比较和分析对抗性实例和常规实例的数据路径。数据路径是一组关键的神经元及其连接。我们将数据路径提取定义为子集选择问题,并通过构建和训练神经网络来解决它。设计了一个多层次的可视化系统,包括数据流的网络级可视化、特征图的层级可视化和学习特征的神经元级可视化,以帮助研究在预测过程中,对抗性和正常示例的数据路径是如何发散和合并的。

Uncertainty

75.Direct Volume Rendering with Nonparametric Models of Uncertainty【非参数统计框架,用于直接体绘制(DVR)中数据不确定性的量化、分析和传播。科学可视化、体绘制】

非参数不确定性模型在不确定性感知的直接体绘制框架内提高了重构和分类的质量。(a)改进泪滴数据集(64 × 64 × 64)的等值面拓扑结构,由于采样和量化的不确定性。(b)由于降采样的不确定性,躯干数据集分类的改进(即骨骼为灰色,肾脏为红色)。

本文提出了一种非参数统计框架,用于直接体绘制(DVR)中数据不确定性的量化、分析和传播。最先进的基于样条的统计DVR框架允许在可视化不确定数据时保留地面真值函数的传递函数(TF);然而,现有的框架仅限于参数噪声假设。在本文中,我们通过扩展非参数噪声分布的DVR框架来解决现有DVR框架的局限性。我们利用分位数插值技术推导出以封闭形式表示观测射线样本强度的不确定性的概率分布。我们的框架的封闭形式的公式允许准确和有效的计算结果。我们通过与平均场和参数统计模型(如均匀、高斯和高斯混合物)的定性和定量比较,证明了我们提出的非参数统计模型的有效性。

76.Uncertainty Visualization of 2D Morse Complex Ensembles Using Statistical Summary Maps【标题即一切】

最左栏的图像描述了二维Morse complexes的输入集合。梯度流中的不确定性,以及由此产生的莫尔斯复合体,在整个输入集合中,然后使用我们提出的统计汇总图(即概率图、显著性图和生存图)进行量化和可视化。

77.Uncertainty-Oriented Ensemble Data Visualization and Exploration using Variable Spatial Spreading【组集数据】

面向不确定性的集成数据可视化框架界面:(A)参数设置面板提供对可视化参数的控制。(B)区域稳定性热图视图显示所选区域的稳定性,通过直接点击进行区域调整。(C) 2D地图视图显示了所选等值的特征,并集成了最新的可视化方法。(D)时间分析视图显示了特征的时间关系并支持时间选择。(E)空间扩展曲线视图显示了变量桶在全局(上)和局部(下)的空间扩展。(F)显示控制工具栏可以在不同的可视化方法之间进行切换。

集合模拟作为处理数值模拟中潜在不确定性的一种重要方法,在许多学科中得到了广泛的应用。可视化是一种很有前途、功能强大的集成仿真分析方法。然而,传统的可视化方法主要是在领域专长的基础上简化数据,突出重要信息,而不是提供灵活的数据探索和干预机制。这种方法必须反复进行试错程序。为了解决这一问题,本文提出了一种以属性变量维为主要分析维的集成数据分析新视角。特别提出了一种基于变量空间扩展的变量不确定性计算方法。在此基础上,我们设计了一个交互式集成分析框架,为集成数据提供了灵活的交互式探索。

78.Uncertainty in Continuous Scatterplots, Continuous Parallel Coordinates, and Fibers【本文将不确定性引入到连续散点图和连续平行坐标中

 不确定的连续散点图,不确定的连续平行坐标,和不确定(范围-)纤维

本文将不确定性引入到连续散点图和连续平行坐标中。我们推导了各自的模型,用基于抽样的蛮力格式验证了它们,并提出了它们的计算加速策略。同时,我们表明,我们的方法本身也适合引入不确定性的纤维的定义在二元数据。

79.Modeling the Influence of Visual Density on Cluster Perception in Scatterplots Using Topology【散点图聚类知觉建模

散点图聚类知觉建模

散点图用于各种视觉分析任务,包括簇识别,散点图上使用的视觉编码在簇的视觉分离级别上起决定性作用。对于可视化设计人员来说,优化可视化编码对于最大化数据的清晰度至关重要。这需要对人类对集群分离的感知进行精确建模,这仍然具有挑战性。我们提出了一项多阶段的用户研究,关注影响散点图中聚类识别的4个因素——聚类分布大小、点的数量、点的大小和点的不透明度。根据这些参数,我们利用拓扑数据分析中的合并树数据结构,构建了基于距离的模型和基于密度的模型。

80.ProReveal: Progressive Visual Analytics with Safeguards【带有安全措施的渐进视觉分析

我们提出了一个新的视觉探索概念——带有安全措施的渐进视觉分析——帮助人们管理渐进数据探索产生的不确定性。尽管渐进式分析具有潜在的好处,但由于各种机器和人为因素,例如采样偏差或对不确定性的误读,渐进式分析的中间知识可能是不正确的。为了缓解这个问题,我们引入了PVA-Guards,人们可以在不确定的中间知识上留下需要验证的保障措施,并基于之前的可视化任务分类推导出7个PVA-Guards。当中间知识失效时,PVA-Guards提供了一种保证结论正确性和理解原因的手段。我们还提出了ProReveal,这是一个概念验证系统,旨在将七种安全措施集成到渐进式数据探索中。

Planets & Space

81.InCorr: Interactive Data-Driven Correlation Panels for Digital Outcrop Analysis【领域扩展、任务旨在寻找火星上过去生命的迹象

InCorr系统概述:(a)露头视图,显示由地质学家用3D标注的数字露头模型,垂直3D测井工具指示层厚。(b) InCorrPanel,显示两个露头的日志,直接由模拟手工插图的注释数据创建。(c)图形用户界面,将岩石类型分配给岩石层。

对3D Digital Outcrop Models(DOMs)进行地质分析,以重建古代居住环境,这是即将进行的ESA ExoMars 2022罗莎琳·富兰克林火星探测器(Rosalind Franklin Rover)和NASA 2020火星探测器(Perseverance)任务的一个关键方面,这些任务旨在寻找火星上过去生命的迹象。地质学家测量并解释3D dom,创建沉积测井曲线,并将其组合在“相关面板”中,以绘制关键地质层位的范围,并建立地层模型,以了解它们在古代景观中的位置。目前,相关面板的创建完全是手动的,因此耗时且不灵活。通过InCorr,我们提出了一种可视化解决方案,包括3D测井工具和交互式数据驱动的对比面板,该面板随着地层分析的发展而发展。在InCorr的创建过程中,我们与主要的行星地质学家以设计研究的形式密切合作。

82.Extraction and Visualization of Poincaré Map Topology for Spacecraft Trajectory Design【结构景观的提取和交互式可视化探索,以辅助航天器轨道规划、领域扩展

任务设计者必须研究许多动力学模型来规划满足任务约束的低成本航天器轨道。他们经常使用Poincaré地图,通过在多体引力系统中发现的周期轨道和不变流形的相互联系的网络来搜索合适的路径。本文研究了这种结构景观的提取和交互式可视化探索,以辅助航天器轨道规划。我们提出算法解决方案,以解决天体动力学问题中拓扑结构表征所带来的具体挑战,并允许对结果信息进行有效的可视化分析。该可视化框架应用于圆形受限三体问题(CR3BP),揭示了新颖的周期轨道及其相关不变流形,并采用合适的格式进行交互转移选择。

83.IsoTrotter: Visually Guided Empirical Modelling of Convection in Meteorology【气象对流的视觉引导经验模型,研究建立一个模型描述大气对流,这个图也挺好看

根据观测数据拟合的经验模型,经常在自然科学中用于描述物理行为和支持发现。然而,随着模型越来越复杂,参数的回归很快就变得不足,需要可视化的参数空间分析来理解和优化模型。在这项工作中,我们提出了一个设计研究建立一个模型描述大气对流。我们提出了一种混合主动的视觉引导建模方法,将交互式视觉参数空间分析与部分自动参数优化集成在一起。我们的方法包括一种新的半自动技术,称为IsoTrotting,其中我们通过沿着模型的等高线导航来优化程序。根据滑翔伞飞行轨迹,利用独特的大气对流观测数据对模型进行了评估。

84.Interactive Visualization of Atmospheric Effects for Celestial Bodies【模型正确地解释了光在大气中的非线性路径(在地球的例子中),分子和尘埃粒子(如臭氧层和火星尘埃)对光的吸收效应,以及米氏散射的波长依赖相函数,图片好看

 用我们的大气模型忠实地再现地球的大气层。大气成分可以改变来模拟外行星大气,或者在这种情况下,根据测量数据来准确地表示大气。从左到右,比较下一行和上一行,我们可以看到地球大气层的尘埃颗粒多了6倍,极化率高了20倍,680 nm波长的空气折射率高了0.5倍,密度高了2倍。

我们提出了一个为行星表面的交互式可视化定制的大气模型。随着对太阳系探索的不断推进,任务和仪器越来越精确,对行星环境的忠实可视化在空间研究、任务规划、科学传播和教育等领域越来越受到关注。大气效应在数据分析和为行星数据提供背景信息方面至关重要。我们的模型正确地解释了光在大气中的非线性路径(在地球的例子中),分子和尘埃粒子(如臭氧层和火星尘埃)对光的吸收效应,以及米氏散射的波长依赖相函数。该模式侧重于交互性、多功能性和自定义,一套全面的交互控件使其能够动态地适应其外观。

85.Interactive Black-Hole Visualization(Honorable Mention)【图好看,算法来可视化黑洞对其远处环境的影响

我们计算一个自适应网格(1秒每个网格)给定的观察者位置和黑洞的旋转。插值网格值以适应给定的输出分辨率。产生的帧(以20毫秒的速度渲染)捕捉了天象图和恒星目录的失真。

我们提出了一种有效的算法来可视化黑洞对其远处环境的影响,就像从轨道附近的观察者看到的那样。我们的解决方案是基于gpu的,建立在两步方法的基础上,其中我们首先导出一个自适应网格,将观察者周围的360视图映射到扭曲的天空,这可以直接用于不同的相机方向。使用网格,我们可以通过扭曲的时空快速追踪光线到观测者,避免了标准实时追踪解决方案的繁重工作量。

86.Polyphorm: Structural Analysis of Cosmological Datasets via Interactive Physarum Polycephalum Visualization【宇宙数据集】

 这张图描述了在分析Bolshoi-Planck宇宙学模拟数据集期间,使用Polyphorm软件工具进行交互式可视化和数据重建,该数据集由大约84万个模拟暗物质晕组成,每个维度的区域跨度为170 Mpc。在这里,整个体被分成4个大小相同的垂直板,每个板显示不同的视图,用于分析暗物质细丝:(a)我们的蒙特卡洛Physarum机器(MCPM)重建算法的原始数据点(红色)和agents(白色),(b)数据的体足迹(“沉积”,白色)和重建的宇宙网细丝密度场(“迹”,紫色),(c)使用热图色板绘制的重建密度场,和(d)相同的密度场,但现在使用另一种颜色地图分割成三个间隔(蓝色为“低”,绿色为“中”,红色为“高”)。灯丝重建和交互式可视化促进了对宇宙网的结构和组成的新见解。

Guidelines & Design Spaces

87.What Makes a Data-GIF Understandable?【标题,关注,主题有趣】

 gif在社交媒体上越来越受欢迎,作为一种数据驱动的可视化叙事格式;简单的视觉信息嵌入在短动画中,通常持续不到15秒,并自动重复播放。在本文中,我们提出了这样一个问题:“是什么让数据gif变得可以理解?”虽然数据视频、信息图或数据漫画等其他叙事形式已经得到了较好的研究,但我们对“数据- gif”的设计因素和原则知之甚少。为了缩小这一差距,我们提供了半结构化访谈和在线研究的结果,共有118名参与者调查了设计决策对数据- gif可理解性的影响。这项研究和我们的后续分析是基于我们在网上找到的108份数据-动图的系统回顾和结构化设计空间。我们的结果显示了来自我们设计空间的设计维度,如动画编码、上下文保存或重复,对观众理解GIF的核心信息的影响。论文最后给出了一系列创建更有效的数据- gif的建议。

88.Guidelines For Pursuing and Revealing Data Abstractions

总结一段时间内的学习事件,它们与备忘录的关系,备忘录与代码的关系,以及代码与主题的关系。顶部的时间轴显示了事件的时间,曲线表示个人备忘录的创建时间。时间轴下面的四行显示了备忘录撰写环境的性质,包括Meetups,数据工作者何时讨论他们的应用数据集,作者何时进行理论讨论,以及作者何时进行开放编码。

89.Composition and Configuration Patterns in Multiple-View Visualizations

多视图可视化(MV)是一种布局设计技术,通常用于帮助用户在单个内聚表示中看到大量的数据属性和值。由于其通用性,MV设计被可视化社区广泛采用,帮助用户查看大型、复杂、高维的数据并与之交互。然而,尽管mv无处不在,但为了更好地理解其设计空间,对其进行分类和分析的工作却很少。因此,如何有效地利用MV设计,目前还没有指导意见。在本文中,我们深入研究了如何在实践中设计mv。我们关注多视图模式的两个基本衡量标准:组成composition,它量化什么视图类型和有多少;配置configuration是指视图布局在显示空间中的空间布置。我们构建了一个新的数据集,包含从2011年至2019年IEEE VIS、EuroVis和PacificVis出版物中收集的360张mtv图像,并对这些可视化图像的视图类型和布局进行细粒度注释。

90.Comparative Layouts Revisited: Design Space, Guidelines, and Future Directions【比较布局大乱炖】

 在我们的文献调查中观察到的比较布局的例子:(A-C)三种原始的比较布局(即并置、叠加和显式编码);(D)相邻条形图之间的视觉连接;(E)对称堆叠的条形图;(F-G)使用项目并置的分组条形图和堆叠条形图;(H)显式编码叠加,用于在分组条形图顶部显示减法值;(I-K)各种图表和项目并列的热图;(L)不同电池尺寸的叠加热图。请注意,在我们的分类中,比较布局的设计空间并不局限于图中所示的12个示例,因为多个布局可以同时在不同的组合中使用,它们可以用于任何可视化类型。

本文系统回顾了信息可视化(InfoVis)的三种比较布局:并置、叠加和显式编码,旨在支持比较任务。在过去的十年中,这些布局已经成为设计许多可视化系统的基本习惯用法。然而,我们发现,布局使用不一致的术语和混淆,从以前的研究的教训是碎片化的。我们研究的目标是将以前的研究结果提炼为一致的、可重用的框架。我们回顾了127篇研究论文,包括15篇采用比较布局的定量用户研究论文。我们首先通过提出清晰的术语(例如,图表式和项目式并置)来缓解比较布局设计空间中的模糊边界。然后,我们确定了比较布局的不同方面,例如在现实场景中使用每种布局的优势和关注点,以及研究人员克服这些关注点的方法。

91.LineSmooth: An Analytical Framework for Evaluating the Effectiveness of Smoothing Techniques on Line Charts【折线图平滑方法】

当折线图数据较大且有噪声时(左上),我们可以通过数据平滑来使其解释更容易。然而,有许多平滑方法可用,例如,12种方法显示在右边,每一种保持输入数据的不同属性。在本文中,我们提供了一个分析框架来比较和排序不同的平滑方法在各种视觉分析任务下的有效性(左下)。

我们提出了一个综合的框架来评估在各种视觉分析任务下的折线图平滑方法。折线图通常用于可视化一系列数据样本。当样本数量较大,或者数据有噪声时,可以应用平滑来使信号更明显。然而,有各种各样的平滑技术可用,每种技术的有效性取决于数据的性质和手边的视觉分析任务。到目前为止,可视化社区缺乏对各种平滑方法进行分析和分类的总结工作。在本文中,我们建立了一个框架,基于与8个低级视觉分析任务相关联的8个线条平滑效果措施。然后我们分析了折线图平滑4类常用的12种方法-秩滤波器、卷积滤波器、频域滤波器和子采样。结果表明,虽然没有一种方法是所有情况下的理想方法,但某些方法,如高斯滤波器和基于拓扑的子采样,总体上表现良好。其他方法,如低通截止滤波器和道格拉斯-佩克子采样,在特定的视觉分析任务中表现良好。几乎同样重要的是,我们的框架证明了几种方法,包括常用的均匀子抽样,产生的结果质量很低,因此,如果可能,应该避免。

92.StackGenVis: Alignment of Data, Algorithms, and Models for Stacking Ensemble Learning Using Performance Metrics【没看懂】

使用StackGenVis从头构建性能堆栈:(a)选择性能指标权重的面板;(b)历史保存面板,其组成和性能由用户建立的存储堆栈实现;(c)比较元模型在主动堆叠和存储堆叠两种情况下的表现;(d)算法、数据和模型的三种探索模式;(e)基于投影的模型的空间可视化,其中总结了所有模型的所有选定性能指标的结果;(f)预测的空间可视化嵌入,它基于当前存储堆栈中模型的集合结果来安排实例。

在机器学习(ML)中,集成方法——如套袋bagging、增强boosting和叠加stacking——是被广泛采用的方法,经常能达到一流的预测性能。堆叠(也称为“堆叠泛化”)是一种集成方法,它将异构的基本模型组合在一起,至少安排在一个层中,然后使用另一个元模型来总结这些模型的预测。尽管它可能是一种提高ML预测性能的高效方法,但从头生成一堆模型可能是一个繁琐的试错过程。这一挑战源于可用解决方案的巨大空间,具有不同的数据实例集和可用于训练的特征,若干算法可供选择,并且这些算法的实例化使用不同的参数(即模型),根据不同的指标表现不同。在这项工作中,我们提出了一个知识生成模型,它支持集成学习与可视化的使用,以及一个视觉分析系统堆叠概化。我们的系统,StackGenVis,帮助用户动态适应性能指标,管理数据实例,为给定的数据集选择最重要的特性,选择一组高性能和多样化的算法,并测量预测性能。因此,我们建议的工具可以帮助用户在不同的模型之间做出决定,并通过移除承诺过高和性能不佳的模型来降低结果栈的复杂性。

Immersion

93.Shared Surfaces and Spaces: Collaborative Data Visualisation in a Co-located Immersive Environment

在我们的沉浸式分析系统FIESTA中,用户群体可以协同可视化和分析多维数据。左上角:现实中看到的;左下:虚拟环境;右:用户共享和共同工作的虚拟房间规模环境的自上而下视图。

沉浸式技术通过头戴式显示器为每个合作者提供一个灵活的共享可视化空间的个人高分辨率视图,为协作式可视化数据分析提供了新的机会。然而,大多数之前的沉浸式协作分析研究都专注于群体如何与桌面和墙壁显示器等表面界面进行互动。本文报道了一项研究,在这项研究中,三个参与者组成的团队被赋予了灵活的可视化创作工具,允许他们在如何构建共享工作空间方面进行很大程度的控制。他们使用一个原型系统,我们称之为FIESTA:自由漫游沉浸式环境,以支持基于团队的分析。与传统的可视化工具不同,FIESTA允许用户在虚拟环境中任意放置创作界面和可视化工件,无论是在虚拟表面还是悬浮在交互空间中。我们的参与者通过创建大量的2D和3D可视化结果,以个人和合作的方式解决了对多元数据集的视觉分析任务。

94.Personal Augmented Reality for Information Visualization on Large Interactive Displays【建议将大型交互式显示器与个人头戴式增强现实(AR)相结合,以实现信息可视化,以促进数据的探索和分析

 大型显示器有利于将大量数据可视化。然而,在感知、个性化视图和管理数据复杂性方面存在挑战。为了解决这些问题,我们建议将大型交互式显示器与个人增强现实相结合。我们通过展示一个广泛的设计空间来探索这种新颖的设置。为了说明这个设计空间,我们设计并实现了各种可视化技术,并通过用例演练验证了它们。此外,我们为Unity开发了一个通用的、数据驱动的可视化框架,我们称之为u2vis。

在这项工作中,我们建议将大型交互式显示器与个人头戴式增强现实(AR)相结合,以实现信息可视化,以促进数据的探索和分析。尽管大型显示器提供了更大的显示空间,但它们在感知、有效的多用户支持以及管理数据密度和复杂性方面具有挑战性。为了解决这些问题并说明我们提出的设置,我们贡献了一个广泛的设计空间,首先包括AR空间中显示、可视化和对象的空间对齐。接下来,我们讨论可以增强可视化的哪些部分。最后,我们分析了如何使用AR来显示个人观点,以显示额外的信息,并减少数据分析师之间的相互干扰。基于这一概念基础,我们提出了一些使用AR扩展可视化的典型技术,并讨论了它们与我们的设计空间的关系。我们进一步描述了这些技术如何解决我们在文献研究中确定的典型可视化问题。为了检验我们的概念,我们引入了一个通用的AR可视化框架以及一个实现了几个示例技术的原型。为了展示它们的潜力,我们进一步展示了一个用例演练,其中我们分析了一个电影数据集。从这些经验,我们得出结论,贡献的技术可以在探索和理解多元数据是有用的。

95.VRIA: A Web-based Framework for Creating Immersive Analytics Experiences【在虚拟现实中创建沉浸式分析(IA)体验

VRIA是一个基于web的框架,用于创建沉浸式分析体验。多元数据集的三维气泡图,约克市电动汽车充电站图和人口数据的三维柱状图。

我们提出了VRIA,一个基于web的框架,用于在虚拟现实中创建沉浸式分析(IA)体验。VRIA建立在WebVR、a - frame、React和D3.js的基础上,提供了一个可视化的创建工作流,使不同专业水平的用户能够快速开发Web的沉浸式分析体验。使用这些基于web的开放标准技术使我们能够在浏览器中实现VR体验,并通过HTML文档对象模型(DOM)与流行的可视化库提供强大的协同作用。这使得VRIA无处不在且平台独立。此外,通过使用WebVR的渐进式增强,VRIA创建的体验可在大量设备上访问。我们详细阐述了我们专注于开放标准Web技术的动机,介绍了VRIA创建工作流,并详细介绍了我们框架的底层机制。

96.Uplift: A Tangible and Immersive Tabletop System for Casual Collaborative Visual Analytics【于休闲协作视觉分析的有形和沉浸式桌面系统

Uplift:用于休闲协作视觉分析的有形和沉浸式桌面系统

 协同视觉分析利用社交互动来支持数据探索和意义构建。这些过程通常被想象为一组专门的专家之间的正式的、扩展的活动,需要使用复杂的数据分析工具的专业知识。然而,有许多专业领域受益于对具有不同知识广度的利益相关者子集之间的短“突发”数据探索的支持。这种“随意协作”的场景将需要吸引用户注意力的迷人功能,以及直观的“走到就可以使用”的界面。本文介绍了一种新型原型系统Uplift,该系统支持校园微电网的“休闲协同视觉分析”,与当地利益相关者共同设计。建筑管理团队的主要成员参加了一个启发式研讨会,向团队中的多位专家传授相关知识,每个专家使用定制的分析工具。为了支持这个复杂领域的休闲协作视觉分析,Uplift在中央桌面显示器上结合了一个引人入胜的3D模型与直观的有形交互,以及增强现实、半空中数据可视化。

97.Revisited: Comparison of Empirical Methods to Evaluate Visualizations Supporting Crafting and Assembly Purposes【online survey, as well as VR, AR, laboratory, and in-situ studies用五种实证研究方法来评估四种情境可视化

我们设计了一个用户研究,用五种实证研究方法来评估四种情境可视化。作为实证方法,我们使用了在线调查,以及VR、AR、实验室和现场研究。来自60名参与者的结果表明,我们在本研究中调查的情境可视化不容易像以前的工作中发现的那样依赖于经验方法。

无处不在的、位置的和物理的可视化为现实世界中的任务提供了全新的可能性,例如医生插入针头。在情境可视化的发展过程中,评价是一个核心环节。然而,评估它们本质上是棘手的,因为真实的场景对安全至关重要或测试成本很高。因此,为了克服这些问题,研究人员和实践者从无处不在的计算和使用替代经验方法,如增强现实(AR),虚拟现实(VR)原型,或仅仅在线演示适应经典的方法。这种方法背后的主要假设是,有意义的见解也可以从不同的、通常更便宜、更简单的经验方法中获得。然而,最近在人机交互(HCI)方面的努力已经发现了反对这一假设的证据,这将阻碍替代经验方法的使用。目前,这些见解依赖于对四个交互对象的单一调查。这项工作的目的是调查这些先前的发现是否也适用于情景可视化。因此,我们首先创建了一个场景,在这个场景中,可视化支持用户自己动手(DIY)任务,如制作和组装。然后,我们建立了五种实证研究方法,使用在线调查,以及VR, AR,实验室和现场研究来评估这四个任务。

98.Embodied Navigation in Immersive Abstract Data Visualization: Is Overview+Detail or Zooming Better for 3D Scatterplots?【报告了第一个系统研究沉浸式导航技术的3D散点图的调查结果。

在我们的用户研究中测试的条件:a)房间大小的界面(或Rm)。b)带有overview(或RmO)的房间大小的界面。c)缩放界面(Zm):用户通过“捏”的手势进行缩放。d)带overview(或ZmO)的缩放界面。

抽象数据没有自然尺度,因此交互式数据可视化必须提供技术,允许用户选择他们的视角和尺度。这些技术在桌面可视化工具中得到了很好的应用。最常见的两种技术是缩放+平移和概述+细节。然而,如何最好地使分析师在沉浸式环境中导航和查看不同级别的抽象数据,此前还没有研究过。我们报告了第一个系统研究沉浸式导航技术的3D散点图的发现。我们测试了四种条件,这些条件代表了我们在沉浸式环境中使标准2D导航技术适应数据可视化的最佳尝试,同时仍然通过物理运动和隐形传输提供标准沉浸式导航技术。我们比较了房间大小的可视化和缩放界面,每一种都有和没有概述。我们发现,在许多标准的视觉分析任务中,参与者的反应时间和准确性存在显著差异。缩放和概览都比标准的移动支持更有优势(例如,物理移动和指针传送)。然而,哪一种变体更优越,取决于任务。

Event Sequence【整个会场论文,保存失败,不想重新来过了】

99.Visual Analytics of Multivariate Event Sequence Data in Racquet Sport【球拍运动】

100.Constructing Spaces and Times for Tactical Analysis in Football【足球】

101.PassVizor: Toward Better Understanding of the Dynamics of Soccer Passes【足球】

102.Once Upon A Time In Visualization: Understanding the Use of Textual Narratives for Causality【因果关系】

103.Visual Causality Analysis of Event Sequence Data【因果关系】

104.Sequence Braiding: Visual Overviews of Temporal Event Sequences and Attributes

Urban Spaces【论文保存失败,不想重新来过】

105.Towards Better Bus Networks: A Visual Analytics Approach

106.Topology Density Map for Urban Data Visualization and Analysis

107.UrbanMotion: Visual Analysis of Metropolitan-Scale Sparse Trajectories

 人群移动轨迹可视化新论文,入选IEEE TVCG及VIS - 知乎

108.Revisiting the Modifiable Areal Unit Problem in Deep Traffic Prediction with Visual Analytics

深度学习方法被越来越多地用于城市交通预测,时空交通数据被聚合成有序组织的矩阵,然后输入到基于卷积的残差神经网络。然而,在这种聚集过程中,众所周知的可修改面积单元问题可能会导致网络输入的扰动。这个问题会严重破坏特征嵌入和预测的稳定性——使得深度网络对专家的用处大大减少。本文通过利用单元可视化技术来解决这一挑战,该技术能够研究城市交通数据动态变化的多标量聚合和神经网络预测之间的多对多关系。通过与领域专家的定期交流,我们设计和开发了一种视觉分析解决方案,该解决方案集成了1)一个双变量地图(Bivariate Map),配备了先进的双变量colormap,以同时描绘输入流量和跨空间的预测误差,2) Moran's I Scatterplot,提供了空间关联分析的局部指标;3)多尺度归因视图,以树状布局布置非线性点图,促进模型的跨尺度分析和比较。

109.Visual Cause Analytics for Traffic Congestion【本文提出了一种基于交通流理论的交通拥堵成因分析方法

我们的交通拥堵原因可视化分析系统。(a)仪表板显示输入数据控件。(b)平行坐标图提供了时空交通拥堵熵的可视化总结。(c)散点图表示网格滤波的熵图和平均车速图。(d)网格地图显示预计会发生拥挤的候选地区。(e)象形文字表示路口车辆的流入和流出。(f) n曲线用于(e)内刷过区域的拥堵类型。(g)日历图显示了与(f)中的n曲线相同的拥堵模式的历史。

城市交通拥堵已经成为一个不仅影响我们日常生活,而且限制经济发展的重要问题。城市交通拥堵的主要原因是车辆数量超过了道路的允许限值。以往的研究主要集中在通过探测城市交通拥堵区域和预测未来趋势来分散交通流量。然而,要解决根本问题,就必须发现交通拥堵的原因。然而,很难找到一项研究,提出了一种方法,以确定交通拥堵的原因。本文提出了一种基于交通流理论的交通拥堵成因分析方法。我们从交通数据中提取车辆流量,如GPS轨迹和车辆检测器数据。我们利用信息论中的熵来检测车辆流量的变化。

110.CrimAnalyzer: Understanding Crime Patterns in São Paulo【犯罪模式,领域扩展】

CrimAnalyzer系统:空间和时间的交互视图使探索局部地区,同时揭示他们的犯罪模式随着时间的推移。

São保罗是南美洲最大的城市,其犯罪率反映了其规模。在城市各地,犯罪的数量和类型差别很大,根据每个特定地点的城市和社会特点,有不同的模式。以前的工作主要集中在分析犯罪,目的是揭示与社会因素、季节性和城市日常活动相关的模式。因此,这些研究和工具更具有全球性,因为它们不是设计来调查城市的特定区域,如特定的社区、街道或公共区域。能够探索城市特定位置的工具对于领域专家以自下而上的方式完成分析至关重要,以揭示城市特征与流动性、路人行为和公共基础设施(如公共交通终端和学校)的存在如何影响犯罪的数量和类型。在本文中,我们提出了CrimAnalyzer,这是一个可视化的分析工具,允许用户研究城市特定区域的犯罪行为。该系统允许用户识别当地的热点和与之相关的犯罪模式,同时仍显示热点和相应的犯罪模式如何随着时间的推移而变化。

111.Chemicals in the Creek: designing a situated data physicalization of open government data with the community【创建一个基于社区的数据展示,以探索情境数据物化和参与式行动研究(Participatory Action Research)是否能够支持对开放数据的有意义的参与

Chemicals in the Creek是一个位于数据物理化,旨在使开放的政府数据可访问和有意义的非专业用户。该活动是(a, b)与马萨诸塞州切尔西的社区伙伴合作设计和创建的,(img: Sara Wylie, Garance Malivel) (c)晚上在切尔西溪举行(img: Will Campbell), (d)专注于当地的行动(img: Sara Wylie)。

在过去的十年中,越来越多的政府数据被公开,试图增加透明度和公民参与,但由于获取和解释这些“开放”数据所需的技术知识的差距,不清楚这些数据是否为非专家社区服务。我们进行了一项为期两年的设计研究,重点是创建一个基于社区的数据展示,使用美国环境保护署(Environmental Protection Agency)在马萨诸塞州切尔西溪(Chelsea Creek)的石油储存设施违反水许可证的数据,以探索情境数据物化和参与式行动研究(Participatory Action Research)是否能够支持对开放数据的有意义的参与。我们之所以选择这些数据,是因为这些数据对当地团体有意义,而且可以在网上找到,但对切尔西社区来说,这些数据在很大程度上是不可见的。

Communities & Communication

112.Designing Narrative-Focused Role-Playing Games for Visualization Literacy in Young Children【面向幼儿视觉素养的角色扮演游戏设计、人文关怀扩展、领域扩展】

样本截图来自我们的教育角色扮演游戏(RPG),以支持11 - 13岁的可视化识字教育。我们的游戏包含了与数据相关的可视化问题,年轻的学习者需要解决这些问题才能在游戏中取得进展。玩家必须首先指出正确的图表来解决问题(a),然后解释所选图表来回答问题(b)。在这项工作中,我们调查了整合叙事元素对学习和参与的影响(c)。

本文以游戏设计和教育研究为基础,介绍以叙事为中心的角色扮演游戏,以促进幼儿的可视化素养。可视化读写技能对于理解我们周围的世界和构建有意义的可视化是至关重要的,然而,如何在很小的时候更好地发展这些技能仍然在很大程度上被忽视和研究不足。直到最近,可视化社区才开始填补这一空白,导致早期教育使用的教育工具的初步研究和开发。我们通过探索游戏化来支持学习,并通过在可视化数据相关问题中利用叙事的存在,找到了应用基于角色扮演游戏设计的机会。我们基于可视化、游戏设计和教育科学的一系列设计考虑,通过技术探索来研究包含叙事元素对学习的影响。

113.Sea of Genes: A Reflection on Visualising Metagenomic Data for Museums【该展览在博物馆的生命系统画廊内,并使用了动画技术和叙事元素的组合,以交流在海洋微生物的宏基因组数据集中发现的发现。领域扩展

 一名参观者在旧金山科学、技术和艺术博物馆的探索博物馆,与基因之海展览互动。该展览在博物馆的生命系统画廊内,并使用了动画技术和叙事元素的组合,以交流在海洋微生物的宏基因组数据集中发现的发现。

我们研究了在科学博物馆中设计一个展览来向公众传达来自复杂数据集和陌生领域的科学发现的过程。我们的展览试图交流基于宏基因组学领域的科学发现的新经验。这个多用户展览有三个目标:(1)让公众了解微生物群落及其日常周期;(2)将微生物的活动与基因表达的概念联系起来;(3)强调科学家利用基因表达数据来理解微生物的作用。为了实现这三个目标,我们用三个相应的故事导出可视化设计,每个故事对应一个目标。我们提出了三个连续的设计和评估我们的尝试传达这些目标。我们可以成功地呈现一个故事,但在实现第二个和第三个目标时却收效甚微。

114.Communicative Visualizations as a Learning Problem【要解决的问题是,设计师描述意图的方式与他们所拥有的语言之间存在根本的不匹配、交际可视化】

大量的研究为探索性可视化的分析提供了健壮的任务和评估语言。不幸的是,这些分类法在应用于交流可视化时失败了。相反,设计师经常从认知效率的角度来评估交际可视化:“接收者能准确地解码我的信息/见解吗?”然而,如果信息是“一只耳朵进,一只耳朵出”,设计师不太可能满意。这种不一致的结果是,很难以一种原则性的方式设计或选择相互竞争的选项。我们要解决的问题是,设计师描述意图的方式与他们所拥有的语言之间存在根本的不匹配。我们认为可视化设计师可以通过学习的视角来解决这一限制:接受者是学生,设计师是老师。通过使用学习目标,设计师可以更好地定义、评估和比较交际可视化。

115.Table Scraps: An Actionable Framework for Multi-Table Data Wrangling From An Artifact Study of Computational Journalism【不理解】

对于许多使用数据和计算来报道新闻的记者来说,数据争论是他们工作中不可分割的一部分。尽管在企业数据分析的背景下有大量关于数据争论的文献,但对于记者在执行这项乏味、耗时的任务时遇到的具体操作、流程和痛点知之甚少。为了更好地了解这一用户群体的需求,我们对26家新闻机构的33名专业记者撰写的50个公共数据仓库和分析代码进行了技术观察研究。我们开发了两种详细的、跨领域的数据分类,用于计算新闻业的行动和过程。我们观察到大量使用了多个表,这与之前的争论分析有明显的差距。我们开发了一个简明、可操作的框架,用于通用的多表数据争吵,其中包括在我们的分类法中记录的、在其他工作中没有明确平行的争吵操作。

116.Data Comics for Reporting Controlled User Studies in Human-Computer Interaction【数据漫画也很有趣的一个方向】

数据漫画的示例,说明了比较加权网络的两种可视化技术的研究。由作者之一通过一个迭代过程创建,基于原始论文中提供的信息。

 受数据漫画的启发,本文介绍了一种新的人机交互领域的受控研究报告格式。虽然HCI的许多研究在解释假设、制定研究设计和报告结果方面遵循类似的步骤,但许多这些决定都隐藏在大量密集的科学文本中。我们建议利用数据漫画作为研究报告,通过紧密整合文本和图像,提供开放和一目了然的研究视图,以视觉方式说明设计决策和关键见解,从而产生对非科学家和研究人员具有吸引力的视觉叙事。数据漫画研究报告的使用案例从面向非科学受众的插图到图形摘要、研究摘要、技术会谈、教科书、教学、博客、补充提交材料,以及包含在科学文章中。本文提供了数据漫画研究报告的例子,以及一个图形化的示例汇编,嵌入了一个创建漫画报告的指导方针框架,该指导方针通过一系列协作设计会议进行迭代和评估。

Geospatial Data

117.Cartographic Relief Shading with Neural Networks【基于神经网络的地图学浮雕着色,有趣的方向

阴影浮雕的高加索山脉创建与神经网络训练与瑞士的手动浮雕阴影。

 阴影浮雕是一种有效的地形图地形可视化方法,特别是在局部调整光照方向以突出地形特征的情况下。然而,数字阴影算法无法完全匹配手工制作的杰作的表现力,手工制作的杰作是由高度专业的制图师通过艰苦的过程创建的。我们使用U-Net神经网络复制手绘的浮雕阴影。深度神经网络使用瑞士地形图系列的手动阴影浮雕图像和同一区域的地形模型进行训练。该网络生成的阴影浮雕与手绘阴影浮雕艺术非常相似。该网络从人工浮雕阴影中学习基本的设计原则,如删除不必要的地形细节,局部调整照明方向以强调个别地形特征,以及改变亮度以强调更大的地形。神经网络阴影是在几秒钟内从数字高程模型中生成的,与18位浮雕阴影专家一起进行的一项研究发现,它们的质量很高。

118.A Simple Pipeline for Coherent Grid Maps【网格地图绘制】(Honorable Mention)

 我们自动计算网格地图的3步管道,在荷兰市政当局的例子中说明:(1)将包含的形状分解成部分;(2)使用这些部件计算一个基于瓷砖的马赛克制图;(3)为每个部件分配元素。

网格地图是简单瓷砖(通常是正方形或六边形)的空间排列,每个瓷砖代表一个空间元素。它们是在每个空间元素中显示复杂数据的一种既定的、有效的方法,在每个贴图中使用视觉编码,从简单着色到嵌套的小倍数可视化。有效的网格地图与潜在的地理空间保持一致:贴图保持相应空间元素的连续性、邻里关系和可识别性,而网格地图作为一个整体保持输入的全局形状。特别重要的是全局形状的显著局部特征,需要用分配给适当空间元素的瓷砖来表示。最先进的技术只能充分处理简单的情况,例如接近均匀的空间分布或具有很少特征的全局形状。我们介绍了一个简单的全自动三步流水线,用于计算相干网格地图。每一步都是一个经过充分研究的问题:基于显著特征的形状分解、基于瓷砖的马赛克地图和点集匹配。

119.Zoomless Maps: External Labeling Methods for the Interactive Exploration of Dense Point Sets at a Fixed Map Scale【超小地图绘制】

在智能手机和智能手表等小屏幕设备上可视化空间数据,对计算制图提出了新的挑战。当前的地图探索界面要求用户频繁地放大和缩小地图。事实上,缩放和平移是适合选择与感兴趣区域对应的地图范围的工具。然而,它们并不适合解决由高特征密度引起的图形混乱,因为放大到一个大的地图比例会导致上下文的丢失。因此,在本文中,我们提出了新的外部标记方法,允许用户在保持当前映射范围固定的情况下通过密集的兴趣点集进行导航。然而,它们并不适合解决由高特征密度引起的图形混乱,因为放大到一个大的地图比例会导致上下文的丢失。因此,在本文中,我们提出了新的外部标记方法,允许用户在保持当前映射范围固定的情况下通过密集的兴趣点集进行导航。

120.Tilt Map: Interactive Transitions Between Choropleth Map, Prism Map and Bar Chart in Immersive Environments【倾斜地图】

 倾斜地图与方向相关的可视化:用户可以倾斜棱镜地图(左),使其变形为垂直的choropleth地图或条形图(中)。从a到g(右)标记角度间隔的过渡段。

我们将介绍倾斜地图,一种新颖的交互技术,用于在沉浸式环境中直观地转换2D和3D地图可视化。我们的重点是在地图上可视化与地物相关的数据,例如,按州划分的人口密度。倾斜地图转换从二维的choropleth地图到3D棱镜地图到2D条形图,以克服每个的限制。我们的论文包括两个用户研究。第一项研究比较了在虚拟现实(VR)中使用2D choropleth地图和3D prism地图解释人口密度数据的受试者的任务表现。我们观察到棱镜图的任务准确性更高,而choropleth图的响应时间更快。这些视图的互补性启发了我们的混合倾斜地图设计。

121.Phoenixmap: An Abstract Approach to Visualize 2D Spatial Distributions【蛮好看的凤凰地图,解决同时可视化多个空间分布的问题

Phoenixmap是一种简单的抽象可视化方法,解决了同时可视化多个空间分布的问题。Phoenixmap能够叠加多个轮廓,并在2D空间中对不同类别的物体进行比较。

 空间数据的多维特性对可视化提出了挑战。在本文中,我们引入了Phoenixmap,一种简单的抽象可视化方法来解决同时可视化多个空间分布的问题。凤凰图方法首先确定点集合的封闭轮廓,然后根据轮廓段对应的内部区域分配不同的宽度。因此,一个二维分布被表示为具有不同厚度的轮廓。Phoenixmap能够叠加多个轮廓,并在2D空间中对不同类别的物体进行比较。我们选择了heatmap作为空间可视化的基准方法,并进行了用户研究来比较Phoenixmap、heatmap和点分布图的性能。

122.MetroSets: Visualizing Sets as Metro Maps【使用地铁地图的隐喻来可视化集合系统

 MetroSets管道:输入集系统(这里是《辛普森一家》中的字符)首先被压缩成一个组合等效的更小实例;步骤1创建优化的路径支持图;步骤2重新插入临时丢弃的元素;步骤3创建支持图的初始布局;最后步骤4将布局示意图为地铁地图,并放置标签。

我们提出MetroSets,一个新的,灵活的在线工具,使用地铁地图的隐喻来可视化集合系统。我们将给定的集合系统建模为超图H = (V;S),由顶点的集合V和集合S组成,集合S包含V的子集,称为超边。然后,我们的系统计算H的地铁地图表示,其中S中的每个超边E对应一条地铁线路,每个顶点对应一个地铁站。

Intelligent Systems

123.Interweaving Multimodal Interaction with Flexible Unit Visualizations for Data Exploration【将笔、触和基于语音的多模态交互与灵活的单元可视化相结合

 在84英寸的Microsoft Surface Hub上运行DataBreeze,在显示器顶部放置一个外部麦克风,用于记录语音输入。

结合了直接操作和自然语言的多模态接口在数据可视化方面有很大的前景。这种多模式界面允许人们通过利用一种模式的优势来补充其他模式的劣势,从而保持在视觉探索的流程中。在这项工作中,我们介绍了一种将直接操作和自然语言与灵活的单元可视化相结合的多模态交互方法。我们在概念验证系统DataBreeze中使用了该方法。将笔、触和基于语音的多模态交互与灵活的单元可视化相结合,DataBreeze允许人们创建系统绑定(例如散点图、单元柱状图)和手动定制视图并进行交互,从而实现了一种新颖的可视化数据探索体验。

124.Competing Models: Inferring Exploration Patterns and Information Relevance via Bayesian Model Selection

在竞争模型框架中,我们将探索模式编码为单个模型,并通过观察用户交互来保持对每个模型生存能力的信念。

分析交互数据为了解用户提供了机会,揭示他们的潜在目标,并创建智能可视化系统。可视化智能响应的第一步是让计算机通过观察用户与系统的交互来推断用户的目标和策略。研究人员提出了多种技术来建模用户,然而,他们的框架往往依赖于可视化设计、交互空间和数据集。由于这些依赖关系,许多技术没有为用户探索建模提供通用的算法解决方案。在本文中,我们基于数据集构建了一系列模型,并将用户探索建模作为一个贝叶斯模型选择问题,其中我们对众多可以解释用户交互的竞争模型保持信念。这些相互竞争的模型中的每一个都代表了用户在会话中可以采用的探索策略。我们技术的目标是通过观察用户的低级交互来对其进行高层次和深层次的推断。虽然我们提出的想法适用于各种概率模型空间,但我们展示了一个编码探索模式作为竞争模型来推断信息相关性的具体实例。

125.II-20: Intelligent and pragmatic analytic categorization of image collections【图像集合的智能和实用分析分类】【俄罗斯方块界面隐喻】【为图像收集的多媒体分析和缩小实用差距带来了三个主要贡献

 II-20充分支持对图像集合进行灵活的分析分类,弥合了实用pragmatic鸿沟。用户可以对图像进行分类或丢弃,系统会智能选择对分类的探索和搜索级别。图:《俄罗斯方块》的界面隐喻。

在本文中,我们介绍了II-20 (Image Insight 2020),一种用于图像集合分析分类的多媒体分析方法。虽然存在针对图像集合的高级可视化,但它们需要与机器模型紧密集成,以支持分析分类的任务。直接使用计算机视觉和交互式学习技术吸引搜索。然而,分析分类不是机器分类(两者之间的区别被称为语用鸿沟):人类在动态中添加/重新定义/删除相关类别来建立洞察力,而机器分类器是僵化的和不适应的。真正让用户洞察的分析分类需要一个灵活的机器模型,允许在探索-搜索轴上动态滑动,以及语义交互:人类主要是在语义术语中思考图像数据。II-20为图像收集的多媒体分析和缩小实用差距带来了三个主要贡献。首先,一个新的机器模型密切跟踪用户的交互,并动态地为其相关类别建模。II-20的机器模型,除了匹配并超越了目前最先进的产生相关建议的能力外,还允许用户在探索-搜索轴上动态滑动,而无需任何额外的输入。

126.Interactive Steering of Hierarchical Clustering【新方法包括1)使用知识(知识驱动)和内在数据分布(数据驱动)自动构建分层聚类的约束,2)通过可视化界面(用户驱动)实现聚类的交互式指导,配色挺好看的

修订:(a)控制面板加载约束和更新聚类结果;(b)约束树;(c)层次聚类结果。颜色编码约束树的第一级类别;(d)资讯面板,以方便了解和订定聚类。

我们提出了一种交互式指导方法,通过利用公共知识(如维基百科)和用户的私人知识来可视化地监督受约束的层次聚类。我们的新方法包括1)使用知识(知识驱动)和内在数据分布(数据驱动)自动构建分层聚类的约束,2)通过可视化界面(用户驱动)实现聚类的交互式指导。我们的方法首先将每个数据项映射到知识库中最相关的项。然后利用蚁群优化算法提取初始约束树。该算法平衡了树的宽度和深度,以较高的置信度覆盖数据项。给定约束树,使用进化贝叶斯玫瑰树对数据项进行分层聚类。为了清晰地传达层次聚类结果,开发了一种不确定感知树可视化,使用户能够快速定位最不确定的子层次并交互改进它们。

127.The Making of Continuous Colormaps【创建、编辑和分析应用程序特定的颜色映射

 图中显示了ccc -工具的Edit-Section的屏幕截图。我们向用户介绍了这个工具来创建、编辑和分析应用程序特定的颜色映射。在这项工作中,我们提出了一个基于网络的软件系统,CCC-Tool(缩写为图表连续Colormaps)下的网址https://ccctool.com,用于创建,编辑和分析应用程序特定的颜色地图。该工具使用了“颜色映射规范(colormap specification, CMS)”的新概念,它维护了定义颜色映射方案所需的基本语义。

连续彩色图是许多可视化技术的组成部分,如热图、表面图和流可视化。尽管对彩虹色地图的批评已经存在了30年,并得到了广泛的认可,但彩虹色地图仍然被广泛使用到今天。彩虹颜色地图具有弹性背后的一个原因是,用户缺乏工具来创建连续的颜色地图,对相关应用程序的特定语义进行编码。在本文中,我们提出了一个基于web的软件系统CCC-Tool(缩写为Charting Continuous Colormaps),网址为https://ccctool.com,用于创建、编辑和分析此类应用特定的彩色地图。我们引入了“颜色映射规范(colormap specification, CMS)”的概念,它维护了定义颜色映射方案所需的基本语义。

128.Argus: Interactive a priori Power Analysis【HCI研究人员在设计对照实验时面临的一个关键挑战是选择适当的参与者数量,或样本大小

HCI研究人员在设计对照实验时面临的一个关键挑战是选择适当的参与者数量,或样本大小。先前的功率分析检查了多个参数之间的关系,包括与人类参与者相关的复杂性,如顺序和疲劳效应,以计算给定实验设计的统计功率。我们创建了Argus,一个支持交互式统计能力探索的工具:研究人员指定不同的混淆和效应大小的实验设计场景。然后,Argus在这些场景中模拟数据并可视化统计能力,这让研究人员交互式地权衡各种权衡,并就样本大小做出明智的决定。

Topology & Scalar Fields

129.TopoMap: A 0-dimensional Homology Preserving Projection of High-Dimensional Data【执行了从高维空间到视觉空间的映射,同时保留了高维数据的Rips过滤的0维持久图,确保过滤在应用于原始数据和投影数据时生成相同的连接组件

 使用几何保持投影(经典MDS, Isomap, tSNE, UMAP)和提出的拓扑保持“TopoMap”方法将三维数据映射到二维空间。虽然几何保存方法倾向于拆分或混合连接的组件,但TopoMap保证保存它们,利用更可靠的分析。

多维投影是高维数据分析和可视化的基本工具。投影技术被设计用于将数据从高维空间映射到视觉空间,以保留一些不同(相似)度量,例如欧几里得距离。事实上,尽管采用了不同的数学公式来支持数据的不同方面,但大多数多维投影方法都努力保存封装了几何属性(如数据对象之间的距离或邻近关系)的不同度量。然而,几何关系并不是唯一在投影中保留的有趣性质。例如,如果映射过程对拓扑不变量(如连接组件和环路)提供一些保证,则可以更可靠地执行对特定结构(如集群和异常值)的分析。本文介绍了一种新的投影技术——TopoMap,它在映射过程中提供拓扑保证。特别地,本文提出的方法执行了从高维空间到视觉空间的映射,同时保留了高维数据的Rips过滤的0维持久图,确保过滤在应用于原始数据和投影数据时生成相同的连接组件。

130.Localized Topological Simplification of Scalar Data【局部化的标量数据拓扑简化算法

我们提出了一种局部化的拓扑简化方法——称为LTS——它计算的结果与在Topology ToolKit中实现的当前最先进的简化过程完全相同,但LTS的速度要快一个数量级,因为它利用了共享内存并行性,并将计算成本很高的过程限制在域的小子集上。这种方法大大加快了拓扑数据分析管道的一个重要部分。

本文提出了一种局部化的标量数据拓扑简化算法,该算法是拓扑数据分析的关键预处理步骤。给定一个标量场f和一组要保留的极值,所提出的局部拓扑化简(LTS)得到一个函数g,它与f很接近,并且只显示所选的极值集。具体地说,与不希望的极值相关的子级和超级集组件首先被局部平坦化,然后被正确地嵌入到全局标量字段中,这样,从组合的角度保证这些区域不再包含任何不希望的极值。与以前的全局方法相比,LTS只独立处理实际上需要简化的域区域,这已经带来了明显的加速。

131.Mode Surfaces of Symmetric Tensor Fields: Topological Analysis and Seamless Extraction【对模态曲面的拓扑结构进行了新的分析,包括使用二维非对称张量对一个张量场的所有模态曲面进行通用参数化

 这个图显示了一个给定的三维对称张量场的模态函数的三个等值面。当模态值接近1 (a)时,正的部分(蓝绿色)和负的部分(金色)一起收敛到退化曲线(彩色曲线)上,当模态值接近0 (c)时,收敛到中性表面(黄绿色)上。模态曲面的拓扑结构由环面(a)变为双环面(c)。当模态曲面与自身(b)接触时产生分岔,形成非流形。

模态曲面是简并曲线和中性曲面的推广,它们构成三维对称张量场。对模态曲面的有效分析和可视化不仅可以为张量场拓扑提供额外的见解,还可以为这些特征如何相互过渡提供额外的见解。现有的模式曲面提取方法耗时长,容易遗漏模式曲面中的特征。此外,从相邻单元提取的模态曲面存在间隙,这给后续分析带来了困难。在本文中,我们对模态曲面的拓扑结构进行了新的分析,包括使用二维非对称张量对一个张量场的所有模态曲面进行通用参数化。

132.A Suggestive Interface for Untangling Mathematical Knots

在这篇文章中,我们提出了一个用户友好的草图为基础的暗示界面解开复杂结构的数学结。我们的界面不是把数学结当作3D绳索来处理,而是设计来帮助用户以正确的数学合法移动顺序与结进行交互。我们的绳结界面允许用户通过提出Reidemeister移动来绘制和解开绳结,并可以通过建议所需的移动来引导用户将数学上的绳结解到尽可能少的交叉数。

133.Geometry-Driven Detection, Tracking and Visual Analysis of Viscous and Gravitational Fingers【探索几何检测和进化的手指详细阐明动力学的不稳定性

 几何驱动的粘性和重力手指可视化分析

粘性和重力流的不稳定性导致位移前缘破裂成手指状流体。在流体力学和水文地质等多学科中,这些指向性不稳定性的检测和演化分析是至关重要的。然而,以往的粘稠手指和重力手指检测方法都是基于密度阈值的,提供的手指几何信息有限。手指的几何结构及其演化是非常重要的,但在文献中研究甚少。在这项工作中,我们探索几何检测和进化的手指详细阐明动力学的不稳定性。我们提出了一种脊体素检测方法来指导从三维标量场中提取手指核。

134.Efficient and Flexible Hierarchical Data Layouts for a Unified Encoding of Scalar Field Precision and Resolution【针对标量场精度和分辨率的统一编码的高效和灵活的分层数据布局

 针对标量场数据,提出了一种高效灵活的数据布局方法

为了解决不断增长的科学数据规模使数据移动成为分析的主要障碍的问题,我们引入了一种新的标量字段编码:一个分辨率和精度的统一树,专门构造,使有效的线索对应于原始字段在精度-分辨率空间中的合理逼近。此外,我们引入了这种树的一种高度灵活的编码,它形成了参数化的数据层次结构家族。我们讨论了在实践中不同的参数选择如何导致不同的权衡,并展示了特定的选择如何导致已知的数据表示方案,如zfp、IDX和JPEG2000。最后,我们提供了系统级的细节和经验证据,说明这样的层次结构是如何以最小的数据移动和时间促进常见的近似查询的,使用的真实数据集的大小从几gb到近tb。

Graphs

135.Responsive Matrix Cells: A Focus+Context Approach for Exploring and Editing Multivariate Graphs【探索和编辑多变量图的焦点+上下文方法

 我们提出Responsive Matrix Cells,这是一种焦点+上下文的方法,通过嵌入在矩阵表示中的可视化来提供多元图的细节。响应式矩阵单元允许分析人员从矩阵的概述到细节,以及在单元内编辑。

矩阵可视化是一个有用的工具来提供一个图的结构的总体概况。对于多元图,剩下的一个挑战是处理与节点和边相关的属性。为了解决这一挑战,我们提出响应式矩阵单元作为焦点+上下文的方法,将额外的交互式视图嵌入到矩阵中。Responsive Matrix Cells是局部可缩放的感兴趣区域,为多元图提供辅助的数据探索和编辑工具。它们通过调整视觉内容来响应单元格位置、可用显示空间和用户任务。响应式矩阵单元使用户能够显示图的细节,比较节点和边的属性,并直接在矩阵中编辑数据值,而无需求助于外部视图或工具。

136.Exemplar-based Layout Fine-tuning for Node-link Diagrams【节点连接图的一种新的布局微调方法,可以根据用户的偏好同时调整多个相似的子结构的布局

在这项工作中,我们提出了一种新的布局微调方法,可以根据用户的偏好同时调整多个相似的子结构的布局。该方法的关键是一种有效的修改-转移算法,可以将一个样本子结构的微调结果转移到其他拓扑类似的子结构。

 我们设计并评估了一种新颖的节点链接图布局微调技术,该技术有助于在批处理模式下基于范例对一组子结构进行调整。关键思想是将局部子结构上的用户修改转移到整个图中拓扑上与示例相似的其他子结构上。我们首先使用节点嵌入技术预计算每个子结构的规范表示,然后使用它进行动态子结构检索。我们设计并开发了一个轻量级的交互系统,以实现直观的调整、修改转移和可视化图形探索。

137.DRGraph: An Efficient Graph Layout Algorithm for Large-scale Graphs by Dimensionality Reduction【大规模图的降维高效图布局算法,比力引导方法好么?关注一下

 大规模图的高效布局仍然是一个具有挑战性的问题:力定向和基于降维的方法在图距离和梯度计算方面存在较大的开销。本文提出了一种新的图布局算法DRGraph,该算法通过三种方案增强了非线性降维过程:利用稀疏距离矩阵逼近图的距离,利用负采样技术估计梯度,以及通过多级布局方案加速优化过程。DRGraph实现了线性复杂度的计算和内存消耗,并扩展到具有数百万节点的大规模图。

138.Scalability of Network Visualisation from a Cognitive Load Perspective【进行了一项对照研究,以了解任务的工作负载限制,该任务需要详细了解网络拓扑结构,即寻找两个节点之间的最短路径。收集了性能指标(准确性和反应时间)、主观反馈和生理指标(脑电图、瞳孔扩张和心率变异性)。据我们所知,这是第一个包含生理测量的网络可视化研究

 在我们的研究中,参与者在网络图上进行寻径练习时,简单任务(左)和困难任务(右)的中位θ脑活动的脑电图EEG地形图。简单任务的主要激活模式与视觉空间导航有关,而复杂任务的激活模式与推理任务(如模式识别、语义编码、检索处理和工作记忆)的激活模式相似。

节点-链路图被广泛用于网络可视化。然而,即使是最好的网络布局算法,当图形达到一定程度的复杂性时,最终也会导致“毛球”可视化,需要通过聚合或交互(如过滤)来简化,以保持可用性。到目前为止,很少有数据表明节点-链接图在何种复杂水平上失效,或者视觉复杂性如何影响认知负荷。为此,我们进行了一项对照研究,以了解任务的工作负载限制,该任务需要详细了解网络拓扑结构,即寻找两个节点之间的最短路径。我们在具有25到175个节点且密度不同的图上测试性能。我们收集了性能指标(准确性和反应时间)、主观反馈和生理指标(脑电图、瞳孔扩张和心率变异性)。据我们所知,这是第一个包含生理测量的网络可视化研究。我们的研究结果表明,人们在超过50个节点的高密度节点-链接图中,甚至在超过100个节点的低密度图中,都很难找到最短路径。从我们收集到的脑电图数据中,我们观察到困难任务和简单任务之间大脑活动的功能差异。

139.A Visual Analytics Framework for Contrastive Network Analysis【一个可视分析框架,利用机器学习的力量来揭示网络中的独特特征,也利用可视化的有效性来理解这种独特性。ContraNA的基础是cNRL,它集成了两种机器学习方案,网络表示学习(NRL)和对比学习(CL),以生成一种低维嵌入,在与另一网络进行比较时揭示一个网络的独特性

分析人员使用ContraNA对两种相互作用网络进行对比分析,LC- multiple(目标网络)和Combined-AP/MS(背景网络)。对比表示视图展示了目标网络和背景网络的对比表示。(b)特征贡献视图将DeepGL生成的网络特征及其对每个cPC的贡献(即按比例缩放的cPC负荷)可视化。(c)概率分布视图描述了(b)中所选网络特征的目标网络和背景网络的概率分布。(d)(e)网络布局视图分别绘制了所布局的目标网络和背景网络。(f)分析人员可以从下拉菜单更改算法和可视化的若干设置。

一个常见的网络分析任务是比较两个网络,以确定一个网络相对于另一个网络的独特特征。例如,当比较来自正常组织和癌症组织的蛋白质相互作用网络时,一个基本任务是发现癌症组织特有的蛋白质-蛋白质相互作用。然而,当网络包含复杂的结构(和语义)关系时,这项任务是具有挑战性的。为了解决这个问题,我们设计了ContraNA,这是一个可视分析框架,利用机器学习的力量来揭示网络中的独特特征,也利用可视化的有效性来理解这种独特性。ContraNA的基础是cNRL,它集成了两种机器学习方案,网络表示学习(NRL)和对比学习(CL),以生成一种低维嵌入,在与另一网络进行比较时揭示一个网络的独特性。

140.SafetyLens: Visual Data Analysis of Functional Safety of Vehicles【一个可视化的数据分析工具,以协助工程师和分析师分析汽车功能安全数据集。SafetyLens结合了网络探索和可视化比较等技术,以帮助分析师执行特定领域的任务

 SafetyLens是一款可视分析工具,通过将特定于领域的数据建模为网络,并将其呈现在交互式可视化系统中,可以帮助领域专家对汽车系统进行功能安全分析。它支持单个数据集的探索性分析(网络探索、直接操作),以及多个数据集的比较分析(网络比较、集可视化)。功能安全分析是一种系统工程技术,旨在最大限度地降低与车辆电气和电子系统相关的不合理风险。

现代汽车已经从单纯的机械机械发展到拥有完善的电子系统,以增强车辆的动力和驾驶体验。然而,这些复杂的硬件和软件系统如果设计不当,可能会出现故障,危及车辆、车内人员和周围环境的安全。例如,一个系统可以在正常工作的情况下启动刹车以避免碰撞,从而挽救生命,但如果刹车的使用方式与设计不符,可能会导致悲惨的结果。广义地说,为最小化此类风险而进行的分析属于系统工程领域,称为功能安全。在本文中,我们提出SafetyLens,一个可视化的数据分析工具,以协助工程师和分析师分析汽车功能安全数据集。SafetyLens结合了网络探索和可视化比较等技术,以帮助分析师执行特定领域的任务。

Automate & Recommend

141.Retrieve-Then-Adapt: Example-based Automatic Generation for Proportion-related Infographics【建议通过自动模仿示例来生成信息图。我们提出了一个两阶段的方法,即检索-然后适应

信息图是一种将图形描述和文本描述相结合,以一种美观有效的方式进行的数据可视化技术。创建信息图是一个困难和耗时的过程,经常需要大量的尝试和调整,即使是有经验的设计师,更不用说具有有限的设计专业知识的新手用户。最近,有人提出了一些方法,通过对用户信息应用预定义的蓝图来自动化创建过程。然而,预定义的蓝图往往很难创建,因此在数量和多样性上受到限制。相比之下,好的信息图是由专业人士创建的,并在互联网上迅速积累起来的。这些网上的例子通常代表了各种各样的设计风格,并为那些喜欢创建自己的信息图的人提供了范例或灵感。基于这些观察结果,我们建议通过自动模仿示例来生成信息图。我们提出了一个两阶段的方法,即检索-然后适应。在检索阶段,我们根据在线实例的视觉元素对其进行索引。对于给定的用户信息,我们通过从已知的可视元素分布中抽样,将其转换为具体查询,然后根据示例索引和查询之间的相似性,在示例库中找到适当的示例。对于检索到的示例,我们通过用用户信息替换其内容来生成初始草案。然而,在许多情况下,用户信息不能完全匹配检索到的示例。因此,我们进一步引入一个适应阶段。具体来说,我们提出了一种类似mcmc的方法,并利用递归神经网络来帮助调整初始草案,迭代改善其视觉外观,直到获得满意的结果。

142.Calliope: A System for Automatic Visual Data Story Generation from a Spreadsheet【可视数据故事生成】

 全自动生成2020年3月新冠病毒在中国传播的可视化数据故事。整个故事由故事情节模式中显示的六个数据事实组成。这个故事首先说明了总死亡人数的总体趋势,其次是中国受影响最大的省份湖北的数据细节的详细说明。最后,通过3月份的总死亡人数和痊愈人数来总结这个故事,说明中国的情况有所改善。

可视化数据故事以海报或数据视频等叙事可视化的形式出现,经常用于以数据为导向的故事讲述中,以促进对故事内容的理解和记忆。虽然有用,但是技术障碍(如数据分析、可视化和脚本)使得生成可视化数据故事变得困难。现有的创作工具依赖于用户的技能和经验,通常效率低下,仍然很困难。在本文中,我们介绍了一种新颖的可视化数据故事生成系统Calliope,它通过自动流程从输入电子表格创建可视化数据故事,并基于在线故事编辑器方便地修改生成的故事。特别是,Calliope集成了一种新的面向逻辑的蒙特卡洛树搜索算法,它探索输入电子表格给出的数据空间,逐步生成故事片段(即数据事实),并按逻辑顺序组织它们。

143.MobileVisFixer: Tailoring Web Visualizations for Mobile Phones Leveraging an Explainable Reinforcement Learning Framework【利用可解释的强化学习框架为手机定制Web可视化将基于svg的可视化从移动或桌面版本转换为移动友好的设计,小屏幕优化

 MobileVisFixer自动将基于svg的可视化从移动或桌面版本转换为移动友好的设计,有几个修改:(A)调整视图和修改轴的大小;(B)调整视图的大小,重新定位图例,修改标题和轴。

我们贡献了MobileVisFixer,这是一种使可视化更加移动友好的新方法。虽然移动设备已经成为访问web上信息的主要手段,但许多现有的可视化并没有针对小屏幕进行优化,可能会导致令人沮丧的用户体验。目前,从业人员和研究人员必须从事一个冗长而耗时的过程,以确保他们的设计能够适应不同尺寸的屏幕,而现有的工具包和库在诊断和修复问题方面提供的支持很少。为了解决这一挑战,MobileVisFixer自动化一个移动友好的可视化重新设计过程与一个新的强化学习框架。为了告知MobileVisFixer的设计,我们首先收集和分析了基于svg的web可视化,并确定了5个常见的移动友好问题。

144.Palettailor: Discriminable Colorization for Categorical Data【分类数据的可区分着色,一种集成的方法来为不同的可视化(如多类散点图、直线图和柱状图)创建和分配调色板,咦,感觉很熟悉

 不同类型的分类数据可视化结果:(左)调色板与着色[6];(中)palttailor vs Tableau [30];(右)调色板与彩色[10]。我们的系统以数据感知的方式将颜色的创造和分配集成到可视化中。

我们提出了一种集成的方法来为不同的可视化(如多类散点图、直线图和柱状图)创建和分配调色板。其他的方法将颜色的创造与他们的任务分开。相比之下,我们的方法考虑了已经考虑到的数据特征来产生调色板,然后以一种促进类更好的视觉区分的方式分配调色板。

145.Gemini: A Grammar and Recommender System for Animated Transitions in Statistical Graphics【一个用于统计图形动画转换的语法和推荐系统、动画转换,关注,有趣

动画转换帮助观看者跟踪相关可视化之间的变化。指定有效的动画需要大量的努力:作者必须选择动画的元素和属性,提供过渡参数,并协调阶段的时间。为了促进这一过程,我们提出了Gemini,一个声明性语法和推荐系统,用于单视图统计图形之间的动画转换。Gemini规范根据高级可视化组件(标记、轴、图例)和用于同步和连接步骤的组合规则定义了转换“步骤”。有了这个语法,Gemini可以推荐动画设计来增强和加速设计师的工作。

146.VizCommender: Computing Text-Based Similarity in Visualization Repositories for Content-Based Recommendation【计算可视化存储库中基于文本的相似度以实现基于内容的推荐

基于云的可视化服务使得可视化分析的受众比以往任何时候都要广泛。像Tableau这样的系统已经开始以交互式可视化工作簿的形式积累越来越大的分析知识仓库。当共享时,这些集合可以形成一个可视化的分析知识库。但是,随着集合规模的增加,查找相关信息的难度也会增加。基于内容的推荐(CBR)系统可以帮助分析人员查找和管理与其兴趣相关的工作簿。为了实现这一目标,我们将重点放在代表可视化主题的基于文本的内容上,而不是可视化编码和样式。我们讨论了基于可视化规范创建案例推理的相关挑战,并更具体地探讨了如何使用Tableau工作簿规范作为内容数据的来源来实现所需的相关措施。我们还演示了可以从这些可视化规范中提取哪些信息,以及如何使用各种自然语言处理技术来计算工作簿之间的相似性,作为衡量相关性的一种方法。

Deep Learning for Spatial Data【会场里的论文多为科学计算相关】

147.Deep Volumetric Ambient Occlusion【一种新的基于深度学习的技术,用于在直接体绘制的背景下进行体环境遮挡

与深度体环境遮挡,我们提出了一种新的基于深度学习的技术体环境遮挡。我们讨论如何额外的,可能的非结构化信息,如传递函数可以提供给3D cnn,并提出我们的外卖量学习。

我们提出了一种新的基于深度学习的技术,用于在直接体绘制的背景下进行体环境遮挡。我们提出的深度体积环境遮挡(DVAO)方法可以在体积数据集中预测每个体素的环境遮挡,同时考虑通过传递函数提供的全局信息。该神经网络只需要在全局信息变化时执行,从而支持实时量交互。

148.A Fluid Flow Data Set for Machine Learning and its Application to Neural Flow Map Interpolation【用于机器学习的流体流数据集及其在神经流图插值中的应用,构建数据集,并应用。类型论文的写法

 我们的非定常流体流动数据集的例子,模拟机器学习的目的。

近年来,深度学习在许多不同的学科中打开了无数的研究机会。目前,可视化主要用于探索和解释神经网络。与之对应的——深度学习在可视化问题上的应用——要求我们更公开地共享数据,以便让更多的科学家参与数据驱动的研究。在本文中,我们构建了一个大的流体流动数据集,并将其应用于科学可视化中的一个深度学习问题。以雷诺数为参数,数据集包含广泛的层流和湍流流态。整个数据集是在高性能计算集群上模拟的,包含8000个与时间相关的2D矢量场,累计大小超过16 TB。使用我们的公共流体数据集,我们训练了深度卷积神经网络,以便为改进的事后拉格朗日流体流动分析设置一个基准。

149.V2V: A Deep Learning Approach to Variable-to-Variable Selection and Translation for Multivariate Time-Varying Data【一种新的深度学习框架V2V,作为多变量时变数据(MTVD)分析与可视化中变量到变量(V2V)选择与转换问题的通用解决方案

 V2V的概述。在特征学习方面,利用U-Net从变量中提取特征,利用t-SNE对特征进行投影,估计变量相似度。根据学习到的变量特征构造了一个平移图。对于变量翻译,选择变量对,训练V2V来学习翻译映射。

我们提出了一种新的深度学习框架V2V,作为多变量时变数据(MTVD)分析与可视化中变量到变量(V2V)选择与转换问题的通用解决方案。V2V利用一种表示学习算法来识别可转移变量,并利用Kullback-Leibler散度来确定源变量和目标变量。然后,它使用生成对抗网络(GAN)通过对抗、体积和特征损失来学习从源变量到目标变量的映射。V2V以源变量和目标变量的时间步长对作为训练的输入。训练完成后,根据源变量对应的时间步长,可以推断出目标变量的不可见时间步长。

150.VC-Net: Deep Volume-Composition Networks for Segmentation and Visualization of Highly Sparse and Noisy Image Data【用于高稀疏和高噪声图像数据分割和可视化的深度体合成网络】【一种端到端的深度学习方法VC-Net,通过将最大强度投影(MIP)生成的图像组合嵌入到三维体图像学习过程中,以增强整体性能,实现对三维微血管结构的鲁棒提取】

研究的根本目的是提出一种新的可视化引导计算范式,将直接三维体处理与体绘制线索相结合,实现有效的三维探索。在本文中,我们提出了一种端到端的深度学习方法VC-Net,通过将最大强度投影(MIP)生成的图像组合嵌入到三维体图像学习过程中,以增强整体性能,实现对三维微血管结构的鲁棒提取。通过使用广泛的公众和真实的患者(微)脑血管图像数据集,对实验结果进行了评估,并与传统的三维血管分割方法和最先进的深度学习方法进行了比较。

 研究的根本目的是提出一种新的可视化引导计算范式,将直接三维体处理与体呈现线索相结合,实现有效的三维勘探。例如,体内微观结构的提取和可视化一直是一个具有挑战性的问题。但由于脑血管数据具有较高的稀疏性和噪声,以及微血管的几何和拓扑变化非常复杂,提取完整的血管三维结构并实现高保真的三维可视化仍然是一项极具挑战性的工作。在本文中,我们提出了一种端到端的深度学习方法VC-Net,通过将最大强度投影(MIP)生成的图像组合嵌入到三维体图像学习过程中,以增强整体性能,实现对三维微血管结构的鲁棒提取。其核心创新在于自动利用体可视化技术(例如MIP——一种用于三维体图像的体绘制方案)来增强深度学习层面的三维数据探索。

151.Interactive Visual Study of Multiple Attributes Learning Model of X-Ray Scattering Images【x射线散射图像】【一个交互式系统,让领域科学家可以直观地研究应用于x射线散射图像的多属性学习模型

现有的用于深度学习的交互式可视化工具主要用于训练、调试和优化自然图像上的神经网络模型。虽然深度学习方法在科学领域也得到了广泛的应用,但对许多科学图像中包含的多个结构属性的分类行为进行可视化分析,并没有得到现有可视化工具的很好支持。在本文中,我们提出了一个交互式系统,让领域科学家可以直观地研究应用于x射线散射图像的多属性学习模型。它允许领域科学家在嵌入空间中交互式地探索这种重要类型的科学图像,嵌入空间是在模型预测输出、实际标签和神经网络的发现特征空间上定义的。用户可以灵活地选择实例映像及其集群,并将它们与指定的属性可视化表示进行比较。探索以模型性能的表现为指导,这些表现与属性之间的相互关系有关,往往会影响学习的准确性和有效性。

152.Volumetric Isosurface Rendering with Deep Learning-Based Super-Resolution【研究了使用这种架构来学习如何将一个等值面的低分辨率采样提升到更高的分辨率,并重建空间细节和阴影

我们的超分辨率网络可以在低分辨率(即320x240)时将等值面的输入采样存储为掩模、法线和深度,在环境遮挡下存储为高分辨率掩模、深度和法线贴图(即1280x960)。屏幕空间中的一个固定的、可微分的着色阶段计算最终输出颜色。

在体场中绘制等值面精确图像通常需要大量的数据样本。减少这一数字是体绘制研究的核心。随着深度学习网络的出现,近年来人们提出了一系列的架构来推断多维领域中的缺失样本,用于图像超分辨率等应用。在本文中,我们研究了使用这种架构来学习如何将一个等值面的低分辨率采样提升到更高的分辨率,并重建空间细节和阴影。我们引入了一个完全卷积的神经网络,来学习产生平滑的、边缘感知的深度和正常场以及低分辨率深度和正常场的环境遮挡的潜在表示。通过在学习阶段加入帧到帧之间的运动损失,升级可以考虑时间变化,从而提高帧到帧之间的一致性。

Decision Making & Reasoning

153.CAVA: A Visual Analytics System for Exploratory Columnar Data Augmentation Using Knowledge Graphs【基于知识图的探索性柱状数据增强可视化分析系统】【CAVA系统,它将数据管理和数据扩充与传统的数据探索和分析任务相结合,使信息在分析过程中的原位收集成为可能

CAVA是一个可视分析应用程序,通过使用知识图的可视分析来增加柱状数据。我们描述了在知识图上识别相关的、可连接的数据的算法,并提供了从这些数据构建复杂属性的可视化编码和交互。

大多数可视分析系统假设所有的数据收集都发生在分析过程之前;一旦分析开始,考虑的数据属性集是固定的。这种数据构建与分析的分离排除了能够根据分析过程中出现的需求进行收集的迭代。采集循环与数据分析任务的分离会限制分析的速度和范围。在本文中,我们提出了一个CAVA系统,它将数据管理和数据扩充与传统的数据探索和分析任务相结合,使信息在分析过程中的原位收集成为可能。确定要添加到数据集的属性是困难的,因为这需要人类的知识来确定哪些可用属性将有助于随后的分析任务。CAVA抓取知识图,为用户提供从外部数据中提取的一组广泛的属性供选择。然后,用户可以指定知识图上的复杂操作来构造附加属性。CAVA展示了视觉分析如何通过让用户可视化地探索可用数据集,以及作为查询构造的界面来帮助用户搜寻属性。它还提供了知识图本身的可视化,以帮助用户理解复杂的连接(如多跳聚合)。

154.An Examination of Grouping and Spatial Organization Tasks for High-Dimensional Data Exploration【高维数据探索中分组和空间组织任务的检验

 理解分析师如何思考分组和空间操作可以帮助设计师更好地开发有用的工具来进行探索性数据分析。我们的研究参与者之一创建了这种放射状布局,这样每只动物都被吸引到它的最高属性,其他大属性值的附加效果。

分析师如何看待分组和空间操作?这个总体问题包含了许多调查要点,包括理解分析师如何开始探索数据集,创建的分组/空间结构的类型和对它们执行的操作,分组和空间结构之间的关系,分析人员在探索个体观察时做出的决策,以及外部信息的作用。这项工作有助于这样一项研究的设计和结果,其中一组参与者被要求组织包含在一个陌生的定量数据集中的数据。我们确定了参与者在设计其组织空间时采用的几种总体方法,讨论了参与者进行的交互,并提出了设计建议,以提高未来使用分组(聚类)和空间(降维)操作的高维数据探索工具的可用性。

155.Boba: Authoring and Visualizing Multiverse Analyses【Multiverse analysis这个概念以前没有注意过

多元Multiverse分析是数据分析的一种方法,在这种方法中,所有“合理”的分析决策都被并行评估,并被集体解释,以促进稳健性和透明度。然而,指定Multiverse是有要求的,因为分析人员必须管理来自分析决策的交叉产品的无数变体,并且结果需要微妙的解释。我们贡献了Boba:一种集成的领域特定语言(DSL)和可视化分析系统,用于创作和审查多元宇宙分析。使用Boba DSL,分析人员只编写一次分析代码的共享部分,以及定义替代决策的局部变体,编译器从中生成表示所有可能分析路径的多路脚本。Boba Visualizer提供了模型结果和多元决策空间的链接视图,以实现对相应决策和稳健性(包括采样不确定性和模型拟合)的快速、系统评估。

156.Supporting the Problem-Solving Loop: Designing Highly Interactive Optimisation Systems【提出并评估了关于设计支持问题解决循环的交互式可视化工具的9条建议

 交互式优化工具的概述,显示了它的三个主要组件:解决方案窗口、解决方案历史和解决方案库(以蓝色突出显示)。子组件用橙色突出显示。交互作用用红色突出显示。

高效的优化算法已经成为寻找高质量解决实际问题的重要工具,如生产调度、时间表或车辆路线。这些算法是典型的“黑匣子”,用于解决问题的数学模型。然而,许多问题很难完全指定,需要一个“human in the loop”与算法协作,通过改进模型和指导搜索来产生可接受的解决方案。最近,问题解决循环作为这种交互优化的高级模型被引入。在这里,我们提出并评估了关于设计支持问题解决循环的交互式可视化工具的9条建议。它们的范围从选择解决方案和约束的可视化表示,到使用解决方案库来支持备选解决方案的探索。

157.Integrating Prior Knowledge in Mixed Initiative Social Network Clustering【一种新的图聚类方法,称为pk-Clustering,帮助社会科学家在社交网络中创建有意义的集群

 我们提出了一种新的图聚类方法,称为pk -聚类。它遵循一个由用户启动的混合倡议过程,并根据所选聚类算法的共识,在这个过程中给出建议。用户必须根据他对数据集的看法和系统的建议来验证结果。

我们提出了一种新的方法,称为pk -集群,以帮助社会科学家在社交网络中创建有意义的集群。许多聚类算法存在,但大多数社会科学家发现它们很难理解,工具没有提供任何指导来选择算法,或评估结果考虑到科学家的先验知识。我们的工作引入了一种新的聚类方法和一个解决这个问题的可视化分析用户界面。它基于这样一个过程:1)将科学家的先验知识捕获为一组不完整的聚类,2)运行多种聚类算法(类似于聚类集成方法),3)将所有算法的结果可视化,并根据每个算法与先验知识的匹配程度进行汇总,4)评估用户选择的算法之间的共识,5)允许用户审查细节并迭代更新所获得的知识。

158.Investigating Visual Analysis of Differentially Private Data【隐私保护可视化privacy-preserving visualizations

 在右边,直方图B(底部)是直方图A(顶部)的私有对应部分。由于注入噪音而引起的数据扰动已导致视觉模式和数据值的明显改变。因此,直方图B在支持多个可视化分析任务方面的效用就大打折扣了。例如,在任务中,使用直方图B“识别具有最小值的组”,即使用户正确地识别出带有红色边框的条是最小的,他基于非私有直方图A的发现仍然是错误的

差分隐私是一种新兴的隐私模型,在许多领域得到了越来越广泛的应用。它的功能是在数据中加入经过仔细校准的噪声,模糊了个人信息,同时保留了总体统计数据。理论上,可以通过绘制差分隐私数据来产生健壮的隐私保护可视化。然而,噪声引起的数据扰动会改变视觉模式,并影响私人可视化的效用。我们仍然对使用私人可视化技术进行可视化数据探索和分析的挑战和机遇知之甚少。作为填补这一空白的第一步,我们进行了众包实验,测量参与者在三个隐私级别(高、低、非隐私)下的表现,并结合八项分析任务和四种可视化类型(柱状图、饼状图、折线图、散点图)。我们的研究结果表明,参与者对摘要型任务(如在数据中找到聚类)的准确性高于价值型任务(如检索某个值)。我们还发现,在DP下,饼状图和折线图提供了类似或更好的准确性比柱状图。

Cognition & Emotion

159.A Bayesian cognition approach for belief updating of correlation judgment through uncertainty visualizations

160.Bayesian-Assisted Inference from Visualized Data

161.Towards Modeling Visualization Processes as Dynamic Bayesian Networks

162.Characterizing the Quality of Insight by Interactions: A Case Study

163.Insight Beyond Numbers: The Impact of Qualitative Factors on Visual Data Analysis

164.EmotionCues: Emotion-Oriented Visual Summarization of Classroom Videos

Sampling

165.Preserving Minority Structures in Graph Sampling
(Honorable Mention)

166.Context-aware Sampling of Large Networks via Graph Representation Learning

167.Evaluation of Sampling Methods for Scatterplots

168.Visual Abstraction of Geographical Point Data with Spatial Autocorrelations

169.STULL: Unbiased Online Sampling for Visual Exploration of Large Spatiotemporal Data

Health & Disease

170.Humane Visual AI: Telling the stories behind a medical condition【有趣、关注】

171.QualDash: Adaptable Generation of Visualisation Dashboards for Healthcare Quality Improvement

172.Visualization of Human Spine Biomechanics for Spinal Surgery

173.In Search of Patient Zero: Visual Analytics of Pathogen Transmission Pathways in Hospitals(Honorable Mention)

174.DPVis: Visual Analytics with Hidden Markov Models for Disease Progression Pathways

175.Modeling in the Time of COVID-19: Statistical and Rule-based Mesoscale Models

Finance & Blockchain

176.TaxThemis: Interactive Mining and Exploration of Suspicious Tax Evasion Group

177.iConViz: Interactive Visual Exploration of the Default Contagion Risk of Networked-Guarantee Loans

178.Visualization of Blockchain Data: A Systematic Review

179.SilkViser: A Visual Explorer of Blockchain-based Cryptocurrency Transaction Data【一种新的在线加密货币交易数据查看工具

许多基于区块链的加密货币为用户提供在线区块链浏览器,以查看在线交易数据。然而,传统的区块链浏览器大多以文本和表格形式显示事务信息。这种形式使得新手用户(NUsers)很难理解加密货币交易机制。这些信息也不足以让有经验的用户(EUsers)识别高级交易信息。这项研究引入了一种新的在线加密货币交易数据查看工具,称为SilkViser。在详细的场景分析和需求分析的指导下,我们创作了一系列具有观赏性的可视化设计,如纸质账本启发的区块和区块链可视化,古代铜币启发的交易可视化,帮助用户理解加密货币交易机制,识别高级交易信息。

 

180.AgentVis: Visual Analysis of Agent Behavior with Hierarchical Glyphs【基于层次符号的智能体行为可视化分析】【集群层次符号,减少了重叠和混乱。每个字形代表一个呼叫中心代理(或组)

左图显示了一个过度绘制的散点图,其中有6500多个字形。右边是等价的集群层次符号,减少了重叠和混乱。每个字形代表一个呼叫中心代理(或组),显示其部门映射的六个属性和颜色。x轴映射到客户反馈的Net Promoter Score (NPS), y轴映射到代理每天接听的平均电话数。

表示复杂行为的符号为可视化多元数据提供了一种有用的通用方法。然而,由于字形的复杂,重叠和遮挡是一个常见而突出的限制。这限制了可以在给定图像中显示的离散数据元组的数量。在一个真实的应用程序中,符号用于描述呼叫中心中的代理行为。然而,许多呼叫中心都有数千名代理。用符号表示数千个代理的标准方法无法伸缩。为了容纳包含数千个字形的可视化,我们将重叠字形聚类开发为单个父字形。这个分层符号表示所有子代理符号的平均值,消除重叠并减少视觉混乱。多变量聚类技术是与呼叫中心行业的领域专家合作探索和开发的。我们根据缩放级别和定制的距离指标实现对字形簇的动态控制,以利用图像空间,减少重叠和杂化。

 

Multidimensional Data

181.SMAP: A Joint Dimensionality Reduction Scheme for Secure Multi-Party Visualization【一种用于安全多方可视化的联合降维方案】【将传统的t-SNE方法从单站点模式重构为一个安全的分布式基础设施

图(a)是SMAP的架构。该系统设置在一台服务器上,组织在线联合嵌入任务。服务器连接并组织两个协作者和多个参与者。协作体S和T分布在两个不同的站点上,相互连接。图(b)是健康记录的联合嵌入结果,包括所有数据的密度图和A、b、C医院的局部密度图。

如今,随着数据变得越来越复杂和分布式,数据分析通常涉及多个存储在不同服务器上的相关数据集,这些数据集可能属于不同的利益相关者。虽然有一个新兴的需求,为这些利益相关者提供他们的数据在全球背景下的全面性,传统的可视化分析方法,如降维,可能会暴露数据隐私,当多方数据集融合到一个单一的站点,以建立点级关系。 在本文中,我们将传统的t-SNE方法从单站点模式重构为一个安全的分布式基础设施。我们提出了一种安全的多方联合t-SNE计算方案,该方案可以将数据泄露的风险降到最低。可以选择使用聚合可视化来隐藏点级关系的公开。

182.Implicit Multidimensional Projection of Local Subspaces【局部子空间的隐式多维投影】【分析局部子空间的形状和方向信息,通过对局部结构的感知获得对数据的全局结构的更多洞察

我们提出了一种可视化方法来理解多维投影对局部子空间的影响,使用隐函数微分。在这里,我们将局部子空间理解为数据点的多维局部邻域。现有的方法主要集中在多维数据点的投影上,忽略了邻域信息。 我们的方法能够分析局部子空间的形状和方向信息,通过对局部结构的感知获得对数据的全局结构的更多洞察。局部子空间由基向量张成的多维椭圆拟合。基于隐函数形式的多维投影的解析微分,提出了一种精确高效的矢量变换方法。

183.Multi-Perspective, Simultaneous Embedding【一种用于高维数据可视化的多视角同时嵌入方法,基于多个数据点之间的成对距离

给定一组物体和匹配投影平面之间的若干距离,MPSE计算所有物体的3D坐标,这样当投影到相应的2D平面时,每个平面上的距离与相应的输入距离相匹配。这个数字的输入数据集的灵感来自James Hopkins的雕塑“1,2,3”。

我们描述了MPSE:一种用于高维数据可视化的多视角同时嵌入方法,基于多个数据点之间的成对距离。具体来说,MPSE计算3D中点的位置,并通过保留每个给定距离矩阵的2D投影(平面)提供对数据的不同视图。我们考虑两个版本的问题:固定投影和可变投影。带有固定投影的MPSE将一组定义在数据点上的成对距离矩阵作为输入,以及相同数量的投影,并将这些点嵌入到3D中,这样成对距离就保留在给定的投影中。带有可变投影的MPSE将一组成对距离矩阵作为输入,并在3D中嵌入点,同时也计算保持成对距离的适当投影。该方法可用于多种场景:从创建同时嵌入同一顶点集的多个图,到从多个2D快照重建一个3D对象,以及从多个角度分析数据。我们提出了一种基于多维尺度对多个距离和多个变量投影的自适应和随机泛化的MPSE功能原型。

184.Visual Analysis of Large Multivariate Scattered Data using Clustering and Probabilistic Summaries【使用聚类和概率总结的大规模多元分散数据可视化分析

快速增长的科学模拟数据规模对交互式可视化和分析技术提出了重大挑战。在这项工作中,我们提出了一个紧凑的概率表示,交互式可视化大的分散的数据集。与以前使用概率分布来表示体积数据块的方法相比,我们对任意结构的多元数据集群建模。详细地,我们讨论了如何有效地表示和存储每个集群的高维分布。我们观察到,一次考虑两个或三个数据维的低维边缘分布就足以使用常见的可视分析技术。基于这一观察,我们用低维高斯混合模型的组合来表示高维分布。我们讨论了常用的交互式可视化分析技术在此表示中的应用。我们观察到,一次考虑两个或三个数据维的低维边缘分布就足以使用常见的可视分析技术。基于这一观察,我们用低维高斯混合模型的组合来表示高维分布。我们讨论了常用的交互式可视分析技术在此表示中的应用。特别地,我们研究了几种基于频率的视图,例如一维和二维密度图、基于密度的平行坐标和时间直方图。

185.t-viSNE: Interactive Assessment and Interpretation of t-SNE Projections【交互式评估和解释t-SNE投影

用于多维数据可视化的t-分布随机邻域嵌入(t-Distributed Stochastic Neighbor Embedding, t-SNE)已被证明是一种很受欢迎的方法,在很多领域都有成功的应用。尽管t-SNE预测很有用,但它们可能很难解释,甚至会造成误导,这损害了结果的可信度。理解t-SNE本身的细节及其输出中特定模式背后的原因可能是一项艰巨的任务,尤其是对非降维专家而言。在这项工作中,我们提出了一种交互式工具t-viSNE,用于视觉探索t-SNE投影,使分析师能够检查其准确性和意义的不同方面,如超参数的影响,距离和邻域保存,密度和特定邻域的成本,以及维度和视觉模式之间的相关性。我们为t-SNE投影的可视化提出了一个连贯的、可访问的和良好集成的不同视图集合。

186.Data-Driven Space-Filling Curves【一种数据驱动的空间填充曲线方法,用于二维和三维可视化。我们灵活的数据驱动的空间填充曲线在空间域中遍历数据元素,结果线性化比现有方法更好地保留了空间中的特征

心脏缺血模拟的集成可视化。中间的成员是体积的——在(左)中呈现——用数据驱动的空间填充曲线(中上)和花生-希尔伯特曲线(中下)线性化的一维函数箱线图。在箱线图中选择潜在值大于3ev的缺血区域,并在(右)中突出显示。

我们提出了一种数据驱动的空间填充曲线方法,用于二维和三维可视化。我们灵活的数据驱动的空间填充曲线在空间域中遍历数据元素,结果线性化比现有方法更好地保留了空间中的特征。我们通过计算哈密顿路径来实现这样的数据一致性,该路径可以近似地最小化描述数据值相似性和邻近位置一致性的目标函数。我们的扩展变体甚至通过四叉树和八叉树支持多尺度数据。我们的方法在许多可视化领域都是有用的,包括多元或比较可视化,二维和三维数据在规则网格上的整体可视化,或粒子模拟的多尺度可视化分析。

Theory

187.Why Visualize? Untangling a Large Network of Arguments【理清一个庞大的争论网络】【理论研究,以了解各种争论的潜在原因;他们的关系(例如,建立和冲突);以及它们各自对任务、用户和数据的依赖关系

许多争论描述了可视化的潜在好处。我们解释了这些参数之间的依赖关系网络。乍一看,论证网络可能看起来令人不知所措,但我们的额外分类有助于导航。该网络可为未来的理论和实证研究提供基础,也可为新的可视化设计提供有用的工具。

可视化已经被研究人员和实践者认为是一种有用的技术,对于可视化的作用的原因留下了一系列的争论。此外,可视化在信息传播中的误导用法也不时被指出。因此,为了有助于对我们学科的基本理解,我们需要一个关于“为什么可视化?”(或者“为什么不呢?”),理清积极和消极观点背后的基本原理。在本文中,我们报告了一个理论研究,以了解各种争论的潜在原因;他们的关系(例如,建立和冲突);以及它们各自对任务、用户和数据的依赖关系。我们策划了一个基于来自不同领域的论据的辩论网络,包括信息可视化、认知科学、心理学、统计学、哲学等。我们的工作提出了几个类别的论点,并使他们的关系明确。我们贡献了第一个全面和系统的关于可视化论点的理论研究。因此,我们提供了一个路线图,以建立可视化理论和实证研究的基础,以及在可视化的批评和设计的实际应用。

188.Introducing Layers of Meaning (LoM): A Framework to Reduce Semantic Distance of Visualization In Humanistic Research【人文研究中减少可视化语义距离的框架】【仔细审查信息与人文学科之间的关系,并建议它的新方向

图表显示了意义层(LoM)框架的五个轴,分为两类。这是一个旨在丰富人文学科研究信息工具语义表达的框架。

信息可视化(infovis)是探索丰富数据集的强大工具。在人文研究的背景下,丰富的定性数据和领域特殊性使得传统的infovis方法显得简化和脱节,导致采用率较低。在这篇论文中,我们使用一个多步骤的方法来仔细审查信息与人文学科之间的关系,并建议它的新方向。我们首先从人文主义的角度来考察信息的人文主义文学。然后,我们通过与人文主义研究人员和信息技术专家共同设计的研讨会来验证和扩展这些发现。然后,我们将我们的研究结果转化为设计师的指导方针,并进行设计评论练习,以探索它们对人文主义研究者感知的影响。

189.Data Visceralization: Enabling Deeper Understanding of Data Using Virtual Reality【使用虚拟现实加深对数据的理解】【探索了使用VR来帮助恢复对单位和度量的基本理解的潜力,这些单位和度量通常在数据可视化中被抽象出来,我们称之为数据全息化

虚拟现实中的数据全息化原型,基于流行的数据表示,寻求对物理测量的更深入理解。(a)奥运男子100米秒成绩记分卡。(b)数据全息化,相当于奥运短跑速度的1比1比例。(c)高大摩天大楼对比图(©射手座A, CC BY-SA 4.0)。(d)数据全息化相当于经验,并比较所选摩天大楼的真实一对一比例。

数据可视化的一个基本部分是将数据转换为将抽象信息映射到可视化属性。虽然这种抽象是数据可视化的强大基础,但表示和原始底层数据(即实际对应的量和测量值)之间的联系可能会丢失。另一方面,虚拟现实(VR)越来越多地用于将真实和抽象的模型作为自然体验呈现给用户。在这项工作中,我们探索了使用VR来帮助恢复对单位和度量的基本理解的潜力,这些单位和度量通常在数据可视化中被抽象出来,我们称之为数据内脏化。通过构建虚拟现实原型作为设计探针,我们确定了数据内脏化的关键主题和因素。我们首先通过作者的批判性反思,然后通过外部参与者来做到这一点。

 

190.Insights From Experiments with Rigor in an EvoBio Design Study【EvoBio设计研究中严谨实验的见解

为我们的基于web的tRRRace EvoBio设计研究界面。在右边,选择的工件显示出相关的概念标签。“进化速率”这个标签被选中了。在左侧,交互时间轴中突出显示了与所选标记共享的所有其他标记。

设计研究是进行问题驱动的可视化研究的既定方法。学术可视化社区已经产生了大量关于设计研究的工作报告,以少量的理论框架为基础,并应用于广泛的应用领域。其结果是大量关于可视化设计的报道,重点是新颖的可视化技术和系统作为这些研究的主要贡献。

在最近的工作中,我们提出了一种新的、解释主义的设计研究视角,以及六个相关的严格标准,强调了研究人员贡献超越可视化习语和软件的知识的机会。在这项工作中,我们与进化生物学家合作了一年,开发了一个交互式工具,用于可视化探索多元数据集和系统发育树。

 

191.A Structured Review of Data Management Technology for Interactive Visualization and Analysis【交互可视化与分析的总数】

在过去的20年里,交互式可视化和分析已经成为数据驱动决策的核心工具。在数据可视化方面的贡献同时,数据管理方面的研究也产生了直接有利于交互分析的技术。在这里,我们对这一邻近领域30年的工作进行了系统的回顾,并强调了我们认为在可视化工作中未得到充分重视的技术和原则。我们沿着两个轴组织我们的回顾。首先,我们使用可视化文献中的任务分类法来构建通常系统中的交互空间。其次,我们创建了数据管理工作的分类,在专用性和通用性之间取得了平衡。具体来说,我们贡献了沿着这两个轴的131篇研究论文的特征。

192.A Design Space of Vision Science Methods for Visualization Research【讨论了视觉科学研究中常用的实验范式、调节类型、响应类型和相关测量方法,并以可视化实例为基础】【关注下】

越来越多的人致力于了解人们在使用可视化时看到了什么。这些努力为补充设计直觉提供了科学依据,导致了更有效的可视化实践。然而,目前已发表的可视化研究反映了一套有限的可用方法来理解人们如何处理可视化数据。视觉科学的替代方法为理解可视化提供了一套丰富的工具,但在感知或可视化研究中都没有这些方法的策划集合。我们引入了一种实验方法的设计空间,用于实证研究与查看数据可视化相关的感知过程,最终为可视化设计指南提供信息。本文为实验可视化研究提供了一个共享词汇库。我们讨论了视觉科学研究中常用的实验范式、调节类型、响应类型和相关测量方法,并以可视化实例为基础。

193.Advanced Rendering of Line Data with Ambient Occlusion and Transparency【带有环境遮挡和透明度的线数据的高级渲染

这张图片显示了六个数据集的示例渲染图,在我们的方法评估期间使用了它们。所有渲染都使用透明度和环境遮挡。线段计数范围从10万(左上)到大约4000万(右下)。

 

194.A Comparison of Rendering Techniques for 3D Line Sets with Transparency

3D线是一种广泛使用的渲染原语,用于可视化研究领域的数据,如流体动力学或纤维束造影术。全局照明效果和透明渲染改善了对三维特征的感知,减少了数据集中的遮挡,从而更好地理解复杂的线数据。我们提出了一种基于gpu的高质量线数据渲染的有效方法,具有环境遮挡和透明效果。我们的方法建立在基于gpu的圆锥的光线投射上,它是类似于截断锥的几何原语,但具有球形的端帽。物体空间环境遮挡是由一种有效的体素锥跟踪方法提供的。我们的核心贡献是一个新的片段可见性排序策略,它允许具有数百万线段的线数据集的交互式可视化。

195.A Discrete Probabilistic Approach to Dense Flow Visualization

用二维数组表示的混合概率矩阵H的拉普拉斯的前四个特征向量显示在最上面一行。特征向量由对应的特征值从左到右排序。在底部一行中,显示了使用流图嵌入的直接体绘制的不同流的可视化。

 

196.Ray Tracing Structured AMR Data Using ExaBricks【结构化AMR数据】

Exajet包含了飞机左侧空气流动的AMR模拟,由656M单元格(跨越四个细化级别)和63.2M三角形组成。为了渲染,我们通过实例镜像数据集,产生了有效的1.31亿实例单元格和126M实例三角形。这个可视化——用我们的方法渲染——显示了流动涡量和速度,涡量的隐式射线跟踪等值面(以速度为颜色绘制),加上涡量场的体积射线跟踪。

结构化自适应网格细化(结构化AMR)使模拟能够适应域分辨率,以节省计算和存储,并已成为科学模拟使用的主要数据表示之一;然而,有效地呈现这些数据仍然是一个挑战。我们提出了一种有效的方法,利用两种不同的数据结构的组合,在配备gpu的工作站上对结构化AMR数据进行体积和等表面射线跟踪。这些使得基于光线跟踪的渲染器能够快速地确定沿着光线的哪个片段需要以哪个频率集成,同时还提供了对平滑样本重构核所需的所有数据值的快速访问。我们的方法使用RTX射线跟踪硬件进行表面渲染、射线移动、空间跳过和自适应采样;并允许交互变化的传递函数和隐式等表面阈值。

 

197.Homomorphic-Encrypted Volume Rendering

我们介绍了一种直接体绘制方法,它可以直接从加密数据集中绘制加密图像。呈现是通过加密数字空间中的操作来执行的,这些操作与明文空间中的操作是对偶的。因此,呈现系统不需要解密数据。这种同态体绘制方法使使用不受信任的服务器进行绘制而不影响隐私成为可能。

需要计算的任务通常在专用的数据中心计算,实时可视化也遵循这一趋势。然而,一些呈现任务需要最高级别的机密性,这样除了所有者之外,没有其他方可以读取或查看敏感数据。我们提出了一种直接体绘制方法,该方法使用同态Paillier加密算法直接对加密的体数据进行体绘制。这使绘制服务器无法解释卷数据和呈现的图像。我们的体绘制管道为加密数据合成、插值、不透明度调制以及简单的传递函数设计引入了新的方法,其中每一个例程都保持了最高级别的隐私。我们提出了与隐私保护方案相关的性能和内存开销分析。我们的方法在设计上是开放和安全的,而不是通过模糊实现安全。数据的所有者只需将她的安全密钥保密,以保证她的体积数据和渲染图像的隐私。据我们所知,我们的工作是第一个保护隐私的远程体积绘制方法,不需要信任任何相关的服务器,即使服务器被破坏,也不会有敏感数据泄漏给外国一方。

 

198.The Mixture Graph - A Data Structure for Compressing, Rendering, and Querying Segmentation Histograms【存储nominal segment IDs的体,例如它们出现在神经科学或材料科学(上),对直接绘制提出了挑战。混合图通过提供一种新的数据结构来解决这一挑战,该结构允许直接基于gpu的数据呈现

存储nominal segment IDs的体,例如它们出现在神经科学或材料科学(上),对直接绘制提出了挑战。混合图通过提供一种新的数据结构来解决这一挑战,该结构允许直接基于gpu的数据呈现。它提供跨mipmap所有级别的交互传递函数更新(下)。此外,该数据结构自然支持体照明、空白跳过,以及跨感兴趣的3D区域分段直方图的加速计算。

在本文中,我们提出了一种新的数据结构,称为混合图。这个数据结构允许我们压缩、渲染和查询分割直方图。当构建包含分段id的卷的mipmap时,会出现这样的直方图。直方图mipmap中的每个体素都包含分割id的凸组合(混合)。每个混合表示id在各自体素的子体素中的分布。我们的方法将这些混合物分解为两个分割id之间的一系列线性插值。结果表示为节点按拓扑顺序排列的有向无环图(DAG)。修剪树中的复制节点,然后进行压缩,可以有效地存储结果数据结构。在渲染过程中,传递函数从源(叶)通过DAG传播,以实现交互式帧率下的高效预过滤渲染。

 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值