图分析中的统计和中心度量算法表

中文

英文

意义

计算方法

度分布

degree distribution

关系多不多

通过度集和顶点集innerjoin算出来

平均路径长度

average path length

网络距离

通过用pregel接口定制算法

网络密度

dense structure

网络密度

通过计算clique来体现,clique的计算是NP问题,所以用count tringle的方法来替代计算。

聚集系数

clustering coefficient

聚集程度,越紧密说明关系越近,排他性越高,越同质。

见《Advanced Analytics with Spark》书中《Analyzing Co-occurrence Networks withGraphX》一节

频度中心

degree centrality

认识人多,粘合,转发枢纽

度数

介质中心

betweenness centrality

不同群组间桥梁,中介

参考Google Wave团队的Daniel Marcous发表的关于Distributed K-Betweenness的内容,其中提到算法只适合大尺度图(比如路网),不适合小尺度图(比如社交网络),但方法可借鉴。

见:https://github.com/dmarcous/spark-betweenness

和https://github.com/Sotera/distributed-graph-analytics/tree/master/dga-graphx中的High Betweenness set extraction

亲近中心

closeness centrality

和其他群组最接近,放哨者,最有先见,最有感知能力

参见École Polytechnique大学Ilias Sarantopoulos发表的关于betweeness的内容,其中closeness centrality 通过下列公式计算:  d(u) = 1 / Sum_of_shortest_paths_from_u_to_all_other_vertices

https://github.com/isaranto/graphx/tree/master/src/main/java/org/centrality/spark

只参考方法

特征向量中心

eigenvector centrality

节点在网络中的重要性

https://github.com/sparkling-graph/sparkling-graph-docs/blob/master/eigenvector.rst

找其参考的Newman的概念定义和实现方法

节点间流量中心

flow betweenness centrality

此节点贡献了与其他节点间最大的关系度

《Current Flow Betweenness Centrality with Apache Spark》25 November 2016

http://for.unipi.it/alessandro_lulli/project/duckweed-betweenness-centrality/ 关注下,论文中的方法可参考。https://github.com/alessandrolulli

小世界现象

small world networks

规则网络,随机网络,小世界网络,自相似网络

通过前面所有统计特性,然后对照小世界现象的定义来确定一个网络是否具有小世界特性。若网络中任意两点间的平均距离L 随网络格点数N 的增加呈对数增长,即 L ~ l n N , 且网络的局部结构上仍具有较明显的集团化特征。

标度特性

scale-free

不同大小样本的网络规律一样

先计算度分布,然后拟合然后将其与zipf/幂律分布对照来判断。(http://tuvalu.santafe.edu/~aaronc/powerlaws/,https://pypi.python.org/pypi/powerlaw)

同配/异配性

assortativity coefficient

度值相近的节点是否倾向于互相连接

networkx/igraph中有相应函数,用得到的返回值根据同配性定义来判断。http://networkx.readthedocs.io/en/stable/reference/algorithms.assortativity.html

互惠性

Reciprocity

两个结点形成相互连接的程度

计算方法见(代码中未列出参考文献):https://networkx.readthedocs.io/en/latest/_modules/networkx/algorithms/reciprocity.html

可从wikipedia中根据定义找计算方法的信息源,但是否可并行化存疑。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值