让边绑定更加清晰：网络可视化中融合绘制方式的探索（Towards Unambiguous Edge Bundling: Investigating Confluent Drawings for Net

最新推荐文章于 2024-07-05 11:32:33 发布

Evan_Gu

最新推荐文章于 2024-07-05 11:32:33 发布

阅读量4.6k

点赞数 1

分类专栏：综合文章标签：可视化 edge-bundling Power Graph 布局边绑定

综合专栏收录该内容

114 篇文章 2 订阅

订阅专栏

原文：请点击这里

本文采用了Confluent Drawing(CD)这种技术，相比较传统的spatial edge-bundling(EB)的方法的优点在于能够按照图的拓扑结构进行边绑定（只有起点与终点相同的边才会在绑定在一起），因此所得到的结果会更加注重图的连接关系。本文所采用的Confluent Drawing(CD)技术是在Power Graph(PG)的基础上完成的，在得到Confluent Drawing的绘制结果之后，文章从系统分析的角度使用图中经常出现的motif检验Confluent Drawing的绘制效果，并且通过User Study的方式比较四种常用的消除连接模糊(edge ambiguity)方法。

边绑定能够有效的减少在图绘制中边的混乱程度。它能够提供给用户复杂连接图的全局概览，同时通过边的粗细与颜色深度也可以提供给用户图中主要连接关系的信息，如图1所示。然而它的方法是将位置上相邻的连线绑定在一起，这种方法主要考虑边之间的距离关系而不是图的拓扑结构，因此会造成图连接关系方面的歧义，用户很难追踪一条边的开始到结束的节点，很多没有相连接的节点给用户的认知是相连的。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-05-%e4%b8%8b%e5%8d%883-17-00

图1 边绑定技术在地图中的应用

边绑定所造成的问题，即未相连的边在用户的感知上是相连的，被称作连接模糊（Edge-ambuiguity），这个问题很早之前就已经被提出。为了解决边绑定中连接模糊的问题，很多工作提出了各类的方法。N. Wong等人在2003年提出了Edgelens[2]，即通过Edgelens的交互方式对于边进行松弛，但是交互的方式无法提供给用户信息的全局概览。有的工作利用提出新颖的可视化形式解决这个问题，比如S. Pupyrev通过Metro-style Bundling[3]的可视化形式将边平行绑定在一起，同时绑定中的每一条边都清楚的绘制出来。有的工作通过限制边绑定的数量避免模糊连接的问题，D. Phan提出的Flow Map Layout[4]将要绑定的边限制在从一个节点出发；S.-J. Luo提出的Ambiguity-free edge-bundling[5]的方法绑定一些不会造成模糊连接问题的边。如图2所示。
related-works

图2 四种边绑定相关的可视化方式，从左至右，(1)是Flow Map Layout，(2)是Ambiguity-free edge-bundling，(3)是Metro-style Bundling，(4)是Edgelens

Confluent Drawing(CD)这种方法相比较传统的spatial edge-bundling(EB)的方法的优点在于能够按照图的拓扑结构进行边绑定（只有起点与终点相同的边才会在绑定在一起），因此所得到的结果会更加注重图的连接关系。Confluent Drawing在图绘制领域很早之前就已经被作为理论提出，但是这种理论的提出主要针对的是任意一个图能否被无交叉的绘制出来，因此一系列关于平面图（图中所有的边能够被绘制在同一个平面上）的工作在此理论的基础上展开，但是没有与这个理论没有应用到非平面图的相关应用中，然而现实生活中大部分都是非平面图，因此，这大大限制了这个方法在我们实际生活中的使用情况。本文所提出的方法也可以被看作是Confluent Drawing(CD)方法在非平面图中的应用。

本文所提出的Confluent Drawing(CD)的方法是在Power Graph[5]的基础上完成的（Power Graph的可视化形式也是由本文的作者之一Tim Dwyer在2013年提出的）Power Graph的可视化方法是通过层次聚合的方法将不同的节点组织在一起，如果一条边与一个聚合节点(super node)相连接，那么代表这个节点与super node中的任意节点之间存在连接关系。Power Graph的可视化形式虽然是由层次聚合的方式将不同的节点组织在一起，但是这种方法与社群类型的可视化方法完全相反，这种方法强调的是最小化其内部的边连接关系，而不是最大化其内部的连接关系。使用Power Graph的方法进行转换的原因是因为Confluent Drawing的基本思想与Power Graph相似，只有相同起点与相同终点的边才会被绑定在一起，六种不同的可视化方式的可视化结果如图3所示。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-09-%e4%b8%8b%e5%8d%886-45-02

图3 No bundling, Edge Bundling, Edge Bundling, Metro-Style Bundling, Power Graphs, Confluent Drawing六种不同的可视化形式的比较

Confluent Drawings构建方式

从Power Graph转换到Confluent Drawings

Confluent Drawing(CD)是通过原始的node-link形式变换为PowerGraph(PG)，然后在PowerGraph的基础之上得到的。从原始node-link graph视图变换为PowerGraph视图已经存在成熟的算法(算法的目标是最优化集合节点之间的连接边)，接下来将PowerGraph转换为Confluent Drawing的过程主要分为5步，如下图3所示，

对于Power Graph(PG)中的每一个集合节点(supernode)新建一个routing节点，routing节点的目的是作为新加的节点（新增加的节点与原始的节点在布局算法中具有相同的参数，只不过在最终绘制的时候不会绘制出来），如图中所示的A，B，C三个点。
将集合节点（supernode）内包含的点与其内部的点之间建立连接关系，如图所示，A与其内部的u，t，s三个节点相连。
将嵌套的集合节点（supernode）之间建立连接，连接图中的A点与B点。
将集合节点(supernode)节点之间的连接关系转换成supernode中的A, B, C三个节点相连接。
将在Power Graph(PG)中普通节点之间的连接关系保留在Confluent Drawing(CD)视图中，如图中所示的是u，v与x，z之间的连接边。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-07-%e4%b8%8a%e5%8d%889-17-55

图4 由Power Graph(PG)转换到Confluent Drawing(CD)中的连接关系构建流程

绘制Confluent Drawing视图

节点布局方式

在Confluent Drawings(CD)的节点布局算法中，需要考虑不仅包括原始节点，而且包括新增加的routing节点，并且节点的布局方式是使用force-directed layout，在使用force-directed layout进行布局时考虑由power graph转换的所有节点之间的连接边。

渲染节点之间的连接边

Confluent Drawings中节点之间的所有连接边通过B-spline曲线连接，将增加的routing node作为B-spline的控制点，这样就自然产生了bundle的效果，bundle的位置即为控制点。无向图与有向图不同的是有向图所增加的控制节点有两个，连入与连出的边分别连接到不同的节点上。

根据学者之间的合作关系数据使用Confluent Drawing方法绘制得到的可视化形式如下图4所示，在下图中蓝色节点代表论文作者，黄色节点代表论文，在这个可视化中，我们可以得到的可视化信息有：

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-05-%e4%b8%8b%e5%8d%8811-45-30

图5 论文合作关系网络图

只跟主要的作者合作并且只有一篇论文的人（使用虚线的圆圈表示）
关系最紧密的合作者（使用黑色的bundle线条连接）
存在3个及3个以上作者的论文（鼠标悬浮到节点上高亮，在图中使用黄色背景标志）

除了按照上述的信息分析论文合作关系网络，还可以使用更加系统的方式来分析Confluent Drawing(CD)绘制的视图，即通过图案分析的方式发现视图中的一些模式，同时判断Confluent Drawing(CD)所绘制的视图能否帮助用户明显的发现这些模式用来检验Condluent Drawing(CD)的可视化效果。下面通过展示Confluent Drawing(CD)对于有代表性的图形的绘制结果分析绘制方式的优劣。

1. Clusters

cluster是一组由一系列节点所组成的子图，子图中的每个节点之间紧密的连接，但是Cluster对于节点之间连接的密度大小并没有明确的定义，在图中一个重要的任务就是对于图中的Cluster进行识别。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-05-%e4%b8%8b%e5%8d%888-45-47

图6 Cluster在三种可视化方式下的可视化效果

如上图5所示，传统node-link方式所得到的子都可以看出节点之间紧密连接的簇，但是在Confluent Drawing(CD)绘制方式与Edge-Bundling(EB)的方式所得到的视图中得到的是紧密绑定的连接边，对于这种类型的连接关系会使得用户对于Cluster难以识别。

2. Cliques

Clique是一个特殊的cluster，即子图的每两个节点之间都存在直接的连接边，也可以把Clique称为一个完全图。Cliques所代表的两两之间均存在连接关系的结构在社会关系中非常重要，因此能准确的识别这类子图也是对于图绘制的重要评判标准。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-05-%e4%b8%8b%e5%8d%8810-33-55

图7 Cliques在三种可视化方式下的可视化效果

如上图6所示，node-link所绘制的无向Clique视图重叠现象非常严重，然而force-directed layout，confluent Drawing三种绘制方式都能得到比较好的效果。

对于有向图的Clique视图采用Confluent Drawing的方式所得到的结果完全不同，而且随着边密度的减小，得到的绘制结果也会存在很大的差别。这也同时证明了这种绘制方式的不稳定性。

3. Bicliques

Bicliques子视图所代表的子图的特点是，节点可以分为几个不同的集合，在相同集合中的节点之间不存在连接关系，只有不同集合之间的节点才会相连。相对于其他的绘制方式，Confluent Drawing的绘制方式对于这种类型的视图的展现结果较好。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-05-%e4%b8%8b%e5%8d%8811-35-57

图8 Biclique在三种可视化方式下的可视化效果

如上图7所示，node-link视图与edge-bundling视图的绘制结果没有明显的展现出视图中的节点的分组关系，只有CD视图中绘制的结果呈现“double-palm-tree”的表现形式，可以帮助用户的识别这种模式。

4. Stars

Star子图的特点是子图中的某一个节点与其他所有节点相连接，同时其他的节点之间不存在连接关系。Star子图与Bicliques子图相类似，CD方式绘制方式相对于其他类型视图的绘制方式表现同样更为明显，如图4(a)所示。

5. Trees

Trees子视图的特点是视图中的节点是按照层级关系进行组织，Tree子图在CD绘制下的图中的表现形式是连续的star视图，如图4(e)所示。

6. Hubs

Hubs所描述的是一个节点相比于网络中的其他节点具有更高的度，即连接网络中的其他节点。在CD绘制的图中，hubs通常的表现形式是连接多个bundle的节点。如图4(b)所示。

7. Articulation points

Articulation point在图中所表示的节点所具有的属性是，如果删除这个节点，那么一个相互连接的图会被分割成两个或者更多的节点。由于CD视图的布局是按照routing graph完成的，因此articulation point在CD视图中与其他两个视图中是相似的。如图所示。

8. Paths and Cycles

Path和Circle表示的子图中的节点是顺序连接的关系。在CD方式绘制的视图中，Paths和Circle相对于其他类型的绘制方式表现的更加明显因为连线使用光滑的arc曲线进行连接，不过也存在一些节点之间的连接线存在不光滑的连接线。如图4(c)所示。

9. Artifacts

在Confluent Drawing所得到的视图中，由于多个视图之间的交错，所得到的视图也有可能错误的反映图的结构，造成用户认知的错误。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-07-%e4%b8%8a%e5%8d%889-43-44

图9 在Confluent Drawing(CD)视图中的Artifacts

<1>. Feet

feet子图表示的两个节点之间存在同一个bundle连接，同时两个节点也是相互连接的。这些节点可能只是连接一个相同的邻居节点，或者是连接一个更大的bundle。如上图8(a)所示。

<2>. Fractals

Fractals看起来是一个树形的拓扑结构，但是Fractals在真实情况下是由cliques所形成的bundle集合。如上图8(b)所示。

<3>. Loops & S-Curves

Loops和S-Curves在CD方法下边绑定所得到的形状使得方向出现变换，这会影响用户对于节点之间连接关系的感知。如上图8(c)所示。

User Study

Readability Study设计

Readability Study主要针对的是用户对于Confluent Graph(CD)方法所得到的结果的可读性以及易学性。

Q1:对于没有图相关理论经验的人能不能理解Confluent Graph视图并且完成基本的任务？由于本文的目的是尝试解决边重叠的问题，因此具体的任务是用户能否在Confluent Graph中对于对于节点之间的连线进行认知。

Q2: 既然我们知道传统的边绑定技术能够造成边模糊，那么从理解分析的角度来说，Confluent Graph中有多少易于出错的地方，相比其他的可视化方式相比有什么区别？

Q3: Confluent Graph是由Power Graph转换得到的，那么这两种可视化之间的任务完成的效率是否存在区别？

Q4: 调研用户对于power graph以及bundling技术的一些主观偏好？

针对上述四个方面的问题，本文中的user study对于Metro-style Bundling，Power Graph，Edge Bundling，Confluent Drawing四种消除边遮挡的技术进行对比。

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-07-%e4%b8%8a%e5%8d%889-48-04

图10 User Study针对的四种可视化形式

由于user study的目的是比较多种不同的可视化方式消除边遮挡问题的能力，因此user study中判断用户能否理解Confluent Graph视图的任务是用户的注意力能否跟随着边之间的连线，具体是两个点之间的最短路径。同时在本文的user study中根据节点的数目，图中节点之间连接边的密度，节点之间嵌套的层数以及图合成的模块数目四个不同原则提供了不同等级的难度。

User Study结果分析

User Study的结果分析主要从准确率以及完成时间两方面衡量，

从任务完成准确率的角度，统计结果如下图所示，

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-06-%e4%b8%8a%e5%8d%8811-46-38

图11 User Study中准确率指标的统计结果

Q1: 对于任务完成的准确率，如图所示，与预期不同的是，CD(Confluent Drawing)并没有比EB(Edge Bundling)方式所得到的视图执行任务的准确率更高，并且对于困难类型的视图任务执行的准确率最低。

Q2: 从易错点的角度，EB(spatial edge bundling)方式得到的结果并没有比CD(Confluent Drawing)绘制方式所得到的结果更多。

Q3: 比较CD(Confluent Drawing)与PG(Power Graph)，CD(Confluent Drawing)比PG(Power Graph)易错点更多。这是因为PG(Power Graph)包含更少的边，因此使得用户更容易从视线上跟随点之间的连边。

从完成时间上方面，统计结果如下图所示，

%e5%b1%8f%e5%b9%95%e5%bf%ab%e7%85%a7-2017-01-06-%e4%b8%8a%e5%8d%8811-46-10

图12 User Study中完成时间指标的统计结果

Q1: 在PG(Power Graph)，MB(Metro-style Bundling)，EB(Spatial Edge Bundling)，CD(Confluent Drawing)四种方式中，PG(Power Graph)是最快的方式，EB(Edge Bundling)是最慢的方式。

Q2: 比较EB(Spatial Edge Bundling)以及CD(Confluent Drawing)，CD所用的时间较少，可以认为EB相对于CD多用的时间即为用户消除图中的模糊连接所耗费的时间。

Q3: 关于PG(Power Graph)与边绑定相关技术的比较，可以发现Power Graph优于其他的方式，因为在power graph中的边相对其他的方式更少。

对于四种方式用户的主观比较：

出乎意料的是，用户认为MB(Metro-style Bundling)与CD(Confluent Drawing)两种方式是最容易学习的，但是PG(Power Graph)方式是最不容易学习的。然而，有趣的一个发现是关于用户对于任务完成的自信度，尽管PG(Power Graph)的准确率很高，但是用户对于通过这种方法所得到的结论的自信度差异较大，很多测试者认为CD(Confluent Drawing)所得到结论的自信度较高，这可能是因为PG(Power Graph)难以学习的原因所导致。

综合任务完成情况以及主观比较两个方面的信息可以得到：CD(Confluent Drawing)容易给用户造成误导，因为CD所得到的信息的准确率并不高，但是用户却对于得出的结论非常自信。EB(Edge bundling)并没有在准确率上与其他的方式差距太大，但是用户却需要花费很长时间寻找路径，因此这从另一方面也验证了文章的动机，即EB会造成用户认知的负担。总结本文中的User Study的结论，效率最高的方式是PG(Power Graph)以及CD(Confluent Drawing)，但是二者相比较而言，CD(Confluent Drawing)需要的学习时间更少。

本文的贡献主要有以下三点：

在任意的有向图/无向图上应用CD(Confluent Drawing)进行边绑定，同时对于图上的节点进行布局。
通过网络中的子图为基准分析对比CD(Confluent Drawing)以及edge bundling的可视化效果。
通过User Study对比CD(Confluent Drawing)以及现有的edge-bundling技术在可读性以及完成任务准确性方面对比。

[1] Bach B, Riche N H, Hurter C, et al. Towards Unambiguous Edge Bundling: Investigating Confluent Drawings for Network Visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2017, 23(1): 541-550.

[2] Wong N, Carpendale S, Greenberg S. Edgelens: An interactive method for managing edge congestion in graphs[C]. Information Visualization, 2003. INFOVIS 2003. IEEE Symposium on. IEEE, 2003: 51-58.

[3]Pupyrev S, Nachmanson L, Bereg S, et al. Edge routing with ordered bundles[C]. International Symposium on Graph Drawing. Springer Berlin Heidelberg, 2011: 136-147.

[4]Phan D, Xiao L, Yeh R, et al. Flow map layout[C]. Information Visualization, 2005. INFOVIS 2005. IEEE Symposium on. IEEE, 2005: 219-224.

[5]Luo S J, Liu C L, Chen B Y, et al. Ambiguity-free edge-bundling for interactive graph visualization[J]. IEEE Transactions on Visualization and Computer Graphics, 2012, 18(5): 810-821.