节点重要性和相似性

参考书籍:《网络科学导论》
参考博文:http://www.cnblogs.com/maybe2030/p/4665847.html
 在我们的现实生活中,许多复杂系统都可以建模成一种复杂网络进行分析,比如常见的电力网络、航空网络、交通网络、计算机网络以及社交网络等等。复杂网络不仅是一种数据的表现形式,它同样也是一种科学研究的手段。复杂网络方面的研究目前受到了广泛的关注和研究,尤其是随着各种在线社交平台的蓬勃发展,各领域对于在线社交网络的研究也越来越火。
 复杂网络就是指一种呈现高度复杂性的网络。钱学森给复杂网络一个严格的定义:具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称之为复杂网络。

博客目录:
1、基础概念
2、HITS算法和PageRank算法
3、节点相似性与链路预测

(一) 基本概念

度值: 与节点A直接相连的节点个数n才计入“度”,称A的度为n。参考《网络科学导论》page159

无向网络重要性指标

网络中一个节点的价值首先取决于这个节点在网络中所处的位置,位置越中心的节点其价值也越大。这就是关于节点中心性指标的研究,它在不同领域都具有重要意义。

度中心性:一个节点的度越大就意味着这个节点越重要,这个指标值用度中心性来衡量。Eg:一个包含N个节点的网络中,节点最大可能性的度值为N-1,为了便于比较而对中心性指标做归一化处理,度为ki的节点的归一化的度中心性值定义为:
图1

介数中心性:如下图所示,从每一块中的任一节点到其它某块中的任一节点的最短路径必然要经过节点H,这种经过某个节点的最短路径的数目来刻画节点重要性的指标就成为介数中心性(Betweeness centrality),简称介数(BC)

这里写图片描述

接近中心性: 也是反映节点在网络中重要性的一种度量
这里写图片描述

K-壳与K-核:

特征向量中心性: 基本想法是:一个节点的重要性既取决于其邻居节点的数量(即该节点的度),也取决于其邻居节点的重要性。特征向量的意义可以理解为节点的重要性。《复杂网路导论》Page165

这里写图片描述

注意:补充概念
邻接矩阵(Adjacency Matrix):是表示顶点之间相邻关系的矩阵。
有三个性质:
①对无向图而言,邻接矩阵一定是对称的,而且主对角线一定为零,副对角线不一定为0,有向图则不一定如此。
无向图的邻接矩阵一定是对称的,而有向图的邻接矩阵不一定对称。

这里写图片描述

如图中,三个节点a、b、c及其权重形成的矩阵称为邻接矩阵。

在无向图中,任一顶点i的度为邻接矩阵第i列(或第i行)所有非零元素的个数,在有向图中顶点i的出度为第i行所有非零元素的个数,而入度为第i列所有非零元素的个数

用邻接矩阵法表示图共需要n^2个空间,由于无向图的邻接矩阵一定具有对称关系,所以扣除对角线为零外,仅需要存储上三角形或下三角形的数据即可,因此仅需要n(n-1)/2个空间。

(二)HITS算法和PageRank算法

1、当考虑有向网络中节点重要性时,一种简单的方法是把有向网络视为无向网络,从而可以直接利用无向网络中节点的重要性指标。另外,有向网络中边的方向对于节点重要性往往是非常重要的。

2、搜索引擎领域已经成为经典的两个算法是Cornell大学Kleinberg提出的HITS算法以及Google创始人Page和Brin提出的PageRank算法。

HITS算法:

参考《网络科学导论》Page167
基本思想:每个网页的重要性有两种刻画指标—权威性(Authority)和枢纽性(Hub)。
这里写图片描述

下面对对HITS算法的描述
这里写图片描述
这里写图片描述

这里只给出该算法的大致情况。并没有讨论其收敛性。

PR值:PageRank算法

定义及算法步骤

  • 6
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值