复杂网络分析(二)

一 ER随机网络

-定义
一个随机图是由N个节点构成并且每对节点之间的连接概率为p
边数分布:满足二项分布,边数分布的平均值=p*N*(N-1)/2,平均度k=p(N-1)
生成ER网络:
依据平均度的取值,可以分为 亚临界(平均度小于1,不存在最大连通集团)、
临界(平均度等于1,存在唯一的最大连通集团)、
超临界(平均度大于1,存在唯一的最大连通集团,群规模分布是更为复杂的指数分布)、
连通(平均度大于lnN,最大连通集团是稠密的,没有群规模分布)


--基本性质
1 随机图往往具有树形拓扑结构,节点度几乎恒定
2 平均距离dmax=logN/log<k>
3 很多网络的平均距离在量级上与它对应的随机网的量级是相同的
4 ER随机网的集聚系数等于两点之间连边的概率。随机网络的集聚系数C很小;
固定网络的平均度,集聚系数C随网络规模N的增长而减小;集聚系数C独立于节点的度

二 小世界网络

-- 小世界特性
六度分离理论:如果从世界上的几十亿人当中随便挑一个人,
并且最多只要说出5个相互认识的人,就能和随便挑的那个人拉上关系。

2016年,Facebook研究数据表明人和人之间的间隔实际上只有3.57个人

小世界网络的“小”:
1 平均距离小:人与人之间的间隔只有3.57
2 集聚系数大:在与朋友的聊天中,会发现 你的某个朋友恰好也是你正在聊天的朋友的朋友

一般网络的集聚系数大于随机网络

-- WS小世界模型
小世界模型算法:给定一个含有N个节点的环状最近邻连接网络,
其中每个节点都与它左右相邻的各m个节点相连。
然后以概率p随机的重新连接网络中原有的每条边,得到WS小世界网络。
-- 具体步骤:
1 在环上按顺时针方向依次访问每个节点
2 假设节点i为当前被访问的节点,顺时针选取与节点i相连的m条边中的每一条连边,边的一个端点仍然固定为i,以概率p随机的选取网络中国呢的任一节点作为该边的另一端点,以概率1-p保持另一端点位置不变
3 在随机连边过程中,不允许出现重边和自环

最近邻环状网络(p=0)➡️小世界网络➡️随机网络(p=1)
               👆
(随着随机系数p增加,网络形态的变化)

小世界性质:
当重连概率p较小([0.01,0.1])时,网络既较短的平均路径长度,又有较高的集聚系数。

--小世界网络中的导航
参考文献: Kleinberg,J(2000). Navigation in a small world. Nature,406(6798),845
当实验者无法全面把握身处的网络结构,即实验者只拥有局部信息而非全局信息。使用分散式贪婪算法描述整个搜索过程,了解搜索目标的地理位置及与当前信息传递着存在连边的所有节点的地理位置。整个搜索过程中,实验者都将信息传递给所有邻居姐弟哪中离搜索目标网格距离最近的节点。
如果说一个网络的搜索时间复杂度随网络的规模N呈对数多项式增长,则称该网络可导航



 

三 无标度网络

--幂律分布
若一个随机变量X服从幂律分布,则其概率密度函数为f(x)=cx^(-y)
二八法则:20%的人口占据了80%的社会财富
无标度网络:网络的度分布为幂律分布的一类网络

--幂律分布的数据拟合
1 数据分箱
对原始数据进行分组,对每一组内的数据进行平滑处理。

平滑处理:
均值平滑(用组内均值来代替组内每个元素)--推荐使用👍
中间值平滑(用组内中间值来代替组内每个元素)
边界平滑(用组内离得较近的边界值来代替组内元素)

常见的分箱方式主要有:
等深分箱(每组数据一样多)、
等宽分箱(每组区间长度一样)、
用户自定义、
最小熵(各分组内的数据具有最小熵)

对数分箱:第i个箱的宽度为b^i,b>1。如b=2时,则第一个箱的宽度为2,第二个箱的宽度为4,第三个箱的宽度为8.
对于幂律分布,在做直线拟合时,采用对数分箱更能准确估计幂指数。

2 累计度分布
累计度分布Pk表示在网络中随机选取一个节点的度不小于k的概率,即若网络中节点的度分布为幂律分布,即则累计度分布函数近似服从幂指数为y-1的幂律分布。
所以通过估计累计度分布的幂指数,进而得到度分布的幂指数
累计度分布可以减少数据波动


--无标度网络的性质
--BA无标度网络模型
实际网络在演化的过程中有新节点的加入,网络规模不断扩大
新节点更倾向于和连边多的节点进行连接
所以,BA无标度网络研究两个问题:
1 增长:在每个时间步,我们向网络中添加以恶搞带有m条连边的新节点,这些边连接到网络中已有的节点上
2 偏好连接:一个新节点与一个已存在的节点i相连的概率ai,与节点i的度ki之间满足以下关系:
ai=ki/(求和kj)
幂指数为3

--满足给定度分布的网络生成模型
1 配置模型
生成事先给定度序列的网络,生成的网络中可能含有自环和重边
参考文献:
B.Bollobsa. A probabilistic proof of an asymptotic formula for the number of labelled regular graphs. Combiner's 1:311-316,1980

M.Molloy and B.A.Reed.Critical Point for Random Graphs with a Given Degree Sequence. Random Structures and Algorithms,6:161-180,1995

2 隐藏参数模型
生成事先给定度分布的网络并生成的网络中不含有自环和重边
假设网络中有N个节点,每个节点被赋予一个隐藏参数y,基于两个节点的隐藏参数判定是否产生连边,通过调整节点的隐藏参数生成满足给定度分布的网络。

参考文献:
G.Caldarelli. Scale-Free Networks from Varying Vertex Intrinsic Fitness. Phys.Ohys.89:258702,2002

B.Soderberg. General formalism for inhomogeneous random graphs. Phys.Rev.e 66:066121,2002

M.Boguna and R. Class of correlated random networks with hidden variables.Phys.Rev.E 68:036112,2003

四 社团结构

--社团研究
是中观尺度网络性质的体现,对网络中社团结构的研究是了解整个网络结构和功能的重要途径

社团结构类型:
1 非重叠社团:一个节点仅属于某一个社团
2 重叠社团:一个节点可能属于多个社团(重叠社团)
3 非完全分类:仅给出某些节点的社团属性

社团结构的基本假设:
连通性、局部相对稠密的连接密度:
不重叠社团是对网络中节点的分组,组内连接相对紧密而组间连接相对稀疏
派系:三个或三个以上的节点组成的全连通子图
k-core子图:子图中的每个节点与子图内的其他节点至少有k条边相连

比较性定义:
弱社团:子图V中所有顶点与V内部顶点的度之和大于V中所有顶点与V外部顶点连接的度之和

--检验划分算法的网络及划分结果比较
1 GN经典人造网


划分结构的比较方法:
共同信息比较法 互信息

--社团划分探测算法
参考文献:
Fortunato(2016). Community detection in networks: a user guide. Physics Report, 659,1-44

Fortunato(2010). Community detection in graphs. Physics Reports,486(3),75-174

1 基于网络的拓扑结构进行分类
GN算法、谱分析算法
2 基于网络上的动力学进行划分
Potts模型、随机游走、把网络抽象成店里网络
3 Q函数优化
极值优化算法、快速算法、
4 基于统计推断方法


基于节点相似性的社团结构划分算法:
定义相似性矩阵➡️拓扑重叠矩阵➡️

 

 

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值