在社交网络数据分析领域,igraph算法包提供了多种应用接口,且支持C、python、R三种语言,通常大家使用python 或 R 的机会更多些。近期出于业务需要,希望提高关系数据计算的效率,我们探索了一下C library的使用方法,以随机游走这个社区挖掘算法为例,进行了尝试,特记录一下,希望能对相关领域的同事有所借鉴。
重点备注
1. 建网络,可以直接调用 igraph_read_graph_ncol 从文件中读取边,而不用一个一个节点去添加
2. 网络属性通过 igraph_cattribute_list 接口存储到不同的向量中,这点尤其会让新人迷惑,因为程序中每个节点是用从0到N-1的数值来表示的,怎么对应到业务上的节点ID,就通过这个来实现,而不用自己新手去建映射关系
3. 随机游走算法通过 igraph_community_walktrap 实现,当然还有很多其它社区挖掘的算法
4. igraph中的数据结构既要初始化,最后也要销毁,否则会报 segmentation fault 错误
上代码
#include <stdio.h>
#include <stdlib.h>
#include </usr/local/igraph-0.7.1/include/igraph.h>
#include <string.h>
#define WALKTRAP_STEPS 0x4
int<