经常有朋友问“那些网络图怎么做出来的呀?”。
其实要画出漂亮、高大上的网络图所需的操作并不复杂。从现在开始尽量多输出一些文章,跟大家分享我们是怎么做出那些网络的。
首先从Gephi-开始介绍,虽然目前也有一些相关介绍文章,我们从自身的经验与理解出发,给大家一些更加多样的参考。希望大家多支持,多交流!
Gephi启动画面
Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。
数据,一般包含各种维度(字段),如时间、数量、金额等。为了数据理解从而支持业务,需要利用可视化的手段对数据的模式进行发现。从数据到可视化形式的逻辑如下:
数据可视化的逻辑
对于我们要研究的数据,其中包含各种维度或者叫字段,例如时间、数量、金额等。为了对数据进行理解从而支持业务,需要利用到可视化的手段对数据的模式进行发现。从数据到可视化形式的逻辑如下:
数据可视化的基本逻辑
将数据中包含的各个维度按照特定的规则映射到我们可以看到的可视化元素上,就是从数据到可视化的基本逻辑。
图数据可视化的逻辑
具体到图数据的可视化,要先从业务数据中抽象出图数据,也就是找到业务数据中的节点和关系,这点可以参考之前的一篇“从数据到网络”。而后就要把图数据按照规则映射到图可视化上。
图数据可视化的基本逻辑
从业务数据中抽象出节点、边以及其相关数据后,还可以通过图计算对构建起的关联数据进行计算,从而得到更多的数据,支持下一步的可视化分析。
因此我们可以进行可视化的数据有两部分,一部分是从业务数据中抽象来的,例如公司是节点,那公司的市值就可以是节点的值,股权投资是关系,股权投资的金额就可以是边的权重。而这些值构建的网络会影响图计算输出的节点类别、位置等。
在进行图计算的时候常用算法的目标1、找到网络中联系较为紧密的社群,从而给节点打上不同的标签;2、利用PageRank等各种算法计算节点的排序,得到节点不同角度的重要性程度度量;3、利用不同的布局算法,得到节点的相对位置,从而可以真正从整体较为清楚的看到整个网络。注意布局算法是必选项,也是网络可视化的基础。
准备好了数据,我们可以开始考虑不同的字段对应到什么可