一. 导读
目前数据可视化大多都以图形界面为主,傻瓜的安装,方便快捷的操作,现代化的版式,便捷的分享和导出。
本文介绍一款开源网络可视化软件----Gephi.Gephi用来做网络的图形化展示,主要应用如下:Exploratory Data Analysis: intuition-oriented analysis by networks manipulations in real time.
Link Analysis: revealing the underlying structures of associations between objects.
Social Network Analysis: easy creation of social data connectors to map community organizations and small-world networks.
Biological Network analysis: representing patterns of biological data.
Poster creation: scientific work promotion with hi-quality printable maps
二. 安装与使用
1. 下载Gephi与JAVA
2. 打开界面后,导入数据
可以从记事本,表单,数据库,网页,创建数据等方式导入数据。即可以导入节点数据和边数据,也可以导入邻接名单。导入数据后的界面如图所示(来自开源facebook数据)
初始数据杂乱无章,看不出规律
3. 此时我们可以查看数据的统计信息,过滤数据;也可以根据统计信息对图形排序和分割,下图对节点度排序(度越大,节点越大,颜色越深)
度越大,节点越大,颜色越深
4. 虽然进行了排序,但是布局样式不容易看出规律,可以对图进行布局。下图使用Frutchterman Reingold 样式进行布局并把线条加深:
Frutchterman 布局
5. 修正并且加上节点标签并导出:如下图所示,从图中我们初步判断747,823,824,828等用户为这组数据的核心用户,由于数据脱敏,我们不知道真实用户是谁。
三 . 进一步
1. Gephi支持手动自动创建数据并支持动态图等,还很多插件几乎可以完成95%以上的需求.
2. 也可以使用JAVA进行算法拓展,参见 Github地址:gephi/gephi