中文 | 英文 | 意义 | 计算方法 |
度分布 | degree distribution | 关系多不多 | 通过度集和顶点集innerjoin算出来 |
平均路径长度 | average path length | 网络距离 | 通过用pregel接口定制算法 |
网络密度 | dense structure | 网络密度 | 通过计算clique来体现,clique的计算是NP问题,所以用count tringle的方法来替代计算。 |
聚集系数 | clustering coefficient | 聚集程度,越紧密说明关系越近,排他性越高,越同质。 | 见《Advanced Analytics with Spark》书中《Analyzing Co-occurrence Networks withGraphX》一节 |
频度中心 | degree centrality | 认识人多,粘合,转发枢纽 | 度数 |
介质中心 | betweenness centrality | 不同群组间桥梁,中介 | 参考Google Wave团队的Daniel Marcous发表的关于Distributed K-Betweenness的内容,其中提到算法只适合大尺度图(比如路网),不适合小尺度图(比如社交网络),但方法可借鉴。 见:https://github.com/dmarcous/spark-betweenness 和https://github.com/Sotera/distributed-graph-analytics/tree/master/dga-graphx中的High Betweenness set extraction |
亲近中心 | closeness centrality | 和其他群组最接近,放哨者,最有先见,最有感知能力 | 参见École Polytechnique大学Ilias Sarantopoulos发表的关于betweeness的内容,其中closeness centrality 通过下列公式计算: d(u) = 1 / Sum_of_shortest_paths_from_u_to_all_other_vertices https://github.com/isaranto/graphx/tree/master/src/main/java/org/centrality/spark 只参考方法 |
特征向量中心 | eigenvector centrality | 节点在网络中的重要性 | https://github.com/sparkling-graph/sparkling-graph-docs/blob/master/eigenvector.rst 找其参考的Newman的概念定义和实现方法 |
节点间流量中心 | flow betweenness centrality | 此节点贡献了与其他节点间最大的关系度 | 《Current Flow Betweenness Centrality with Apache Spark》25 November 2016 http://for.unipi.it/alessandro_lulli/project/duckweed-betweenness-centrality/ 关注下,论文中的方法可参考。https://github.com/alessandrolulli |
小世界现象 | small world networks | 规则网络,随机网络,小世界网络,自相似网络 | 通过前面所有统计特性,然后对照小世界现象的定义来确定一个网络是否具有小世界特性。若网络中任意两点间的平均距离L 随网络格点数N 的增加呈对数增长,即 L ~ l n N , 且网络的局部结构上仍具有较明显的集团化特征。 |
标度特性 | scale-free | 不同大小样本的网络规律一样 | 先计算度分布,然后拟合然后将其与zipf/幂律分布对照来判断。(http://tuvalu.santafe.edu/~aaronc/powerlaws/,https://pypi.python.org/pypi/powerlaw) |
同配/异配性 | assortativity coefficient | 度值相近的节点是否倾向于互相连接 | networkx/igraph中有相应函数,用得到的返回值根据同配性定义来判断。http://networkx.readthedocs.io/en/stable/reference/algorithms.assortativity.html |
互惠性 | Reciprocity | 两个结点形成相互连接的程度 | 计算方法见(代码中未列出参考文献):https://networkx.readthedocs.io/en/latest/_modules/networkx/algorithms/reciprocity.html 可从wikipedia中根据定义找计算方法的信息源,但是否可并行化存疑。 |
图分析中的统计和中心度量算法表
最新推荐文章于 2022-05-07 18:10:14 发布