3 v4 中心节点固定_识别网络传播过程中有影响力的节点——论文阅读小结

该文章是2010年发表在nature physics上的文章:Identification of influential spreaders in complex networks

一、主要内容

传播能力较强的节点不一定是连通度最大或者节点中心度最高的节点,而是处于网络“核心”的节点,可以通过K-shell分解找到网络的“核心”。当同时考虑多个初始传播者的时候,传播者间的距离是预测传播规模(范围)的重要参数。另外,本文还发现感染会一直存在高k-shell的区域中,恢复的个体不会形成免疫。该工作可为设计有效传播策略提供指导。

二、写作逻辑

  1. 摘要
  • 说明研究背景:网络是什么,在传播现象(观点传播、传染病扩散)中扮演什么角色
  • 说明研究意义:识别网络中最有效的传播节点有何意义?优化资源利用,便于制定更有效的信息传播策略
  • 说明本文观点与之前研究的不同点
  • 说明本文的发现
  • 说明该研究工作的意义

2. 正文

  • 第一段对传播过程进行概述。首先说明传播现象对社会活动的描述能力,然后回答为什么需要研究传播?(阻碍疾病传播或者加速信息传播)。社交网络分析领域目前认为怎样的节点传播能力最强(度最大的节点、介数中心性最大的节点)。
  • 第二段讲本文的观点及主要成果。

观点:度最大或者介数中心性最大的节点可能对于传播过程影响较小,比如说当这个节点存在分支的末端或者网络的外围时,在传播过程中这个节点对于网络中心的影响就会很小。一个度相对较小但处于网络中心的节点/个体会对最终人口感染比例会有更显著的影响。

(PS思考:当节点存在分支末端或者网络的外围时,这个节点的度或者介数中心性有可能最大吗?什么是“网络中心”)

如何识别网络的核心?采用k-shell(或称k-core)分解方法。

说明该方法的好处。在多个真实网络,起源于单个节点的传播过程中,该方法能够识别出网络中最好的传播者。对于起源于多个节点的传播过程,可以通过考虑传播源的距离来进一步提高效率(这句话怎么理解?)

  • 第三段概述本文实验涉及的数据集。对真实世界中能表示社会结构的典型复杂网络案例进行研究。共四个网络,朋友关系网络、邮件通信网络、病人接触网络、演员合作网络。
  • 第四段说明本文实验的传播过程:SIR模型。对模型更详细的在“方法”章节中。
  • 第五段说明如何通过k-shell为决定每个节点的位置
    。具有小
    的节点对应着网络的外围,具有更大的
    在网络的中心,如图1a所示。通过图1b-d的可视化说明传播过程中,感染规模并不一定与源头节点的度k相关。从具有相似度值的节点开始的传播过程可能会非常不同。图1b和d可说明在同一个
    层的节点所产生的传播区域会非常相似,尽管其度值不同(根据定义,在一层k壳中,可以有很多歌节点的度大于

8f71a6b02e16ddee77428e3976dc1d88.png
图1: 什么时候hub节点可能不是好的传播者
  • 第六段是对第五段的论述的进一步总结,并提出定量测度节点在传播过程中影响力的方法/指标。相比节点的一个局部性质(如节点度),节点在网络中的位置更能决定传播的影响力。定义从具有属性
    的节点i爆发的疫情所感染人口的平均规模为
    。具有属性
    的节点所能造成的感染规模为:

  • 第七段是对实验结果的总结:

(1)固定一个度值,可以有很多种传播结果

。特别地,很多在网络外围的hub节点(高度、低
)都是较差的传播者。

(2)固定一个

,传播结果
与度值几乎不相关。

(3)最有效率的传播者在网络的中心(较大

的区域),当传播行为由网络的中心开始,病毒能够有很多途径影响剩余网络,不管节点的度是多少都能得到这个结果。

96db8ca2486ddb6f65b4de11a0dad0c6.png
图2 k-shell索引能够比节点的度值或者介数中心性更能预测传播结果
  • 第八段引入不精确度函数(iimprecision function)量化传播过程中
    的重要性。对比了 将k、
    三个指标分别作为传播重要性度量时所得到的传播效率的不精确度。发现
    对应的不精确度最低,
    对应的不精确度最高,如图3a所示。

73d4970f4aa393c45e14b94c6eb22de0.png
图3 CNI网络的k-shell结构
  • 第九段说明了作者们的额外探索:本文发现不仅仅适用于社交网络,在路由器网络中也有相似的结论。再次强调本文工作所提供的关键insight:有很多hub节点是处于网络的边缘的,这些节点实际上是较差的传播者。简单解释为什么会有很多hub节点位于网络外围,真实世界的网络跟随机网络有何不同。
  • 前面着重论述单个传播源头的传播过程中,初始传播节点在网络中的位置很重要,第十段考虑多个初始爆发点的情形。图3d表明尽管高
    的节点是较好的传播者,但多个高连通度的节点的传播效率可能要比多个高
    节点的传播效率高。为什么会这样?原因是不同传播者的感染区域重叠。高
    节点往往比较相近;而度值高的节点可以遍布网络,并不需要互相连通。
  • 第十一段讨论恢复后不能免疫的传染行为,如性传染病。这些传播过程更适合通过SIS模型描述。
  • 第十二段讨论随机网络跟真实网络性质的不同,并说明其在真实网络上的传播实验的发现与以往做随机网络传播实验所得结果的明显不同,
    能很好地解释真实网络局部所具有的“地方病”现象。
  • 第十三段通过研究节点的渐近感染概率说明高
    节点对于SIS传播过程的重要性。

af1a51e963d3d3530e10b84b9dae8344.png
图4 CNI网络中的传播过程以及SIS和SIR传播过程对于传染率beta的依赖性
  • 说明网络内部节点在传播过程的重要性的鲁棒性,这种鲁棒性不会被传染概率值
    影响,如图4c-d所示。
  • 最后一段总结全文结论:

(1)当传播过程来自单个节点时,

足以做排名了;

(2)有多个节点同时成为初始传播者时,多个高度节点对传播的加强作用比多个高

的作用大;

(3)在不会形成免疫的传播过程,网络中心处(高

)的节点会一直保持局部的感染状态。

三、技术细节

k-shell分解

迭代式地移除网络中度为k的节点,直到网络中没有度为k的节点为止,则被移除的节点位于k-shell中。实际实现时:取k=1,2,3,……,得到一层层的k-shell节点。整个网络可以看作k-shell的联合。

传播模型

SIR:初始阶段,只有一个节点处于感染状态,其余节点均处于易感状态。之后在每个时间步,感染状态的节点以概率

感染邻域内的易感节点,进入恢复状态。

SIS:与SIR模型的不同之处在于,对于每个被感染的节点,要么以概率

(论文中该参数取0.8)回复到易感状态,随后可以在每个时间步中受到感染,要么以
的概率保持感染状态

不精确函数

量化采用不同的传播能力指标所得到的

个节点(按指标降序排名选取前面的节点)平均传播规模跟
个最有效率的节点所得到的平均传播规模
的差异。如:

四、实验设计

首先通过探索性实验(可视化)说明具有不同特征的节点在网络中的位置具有明显不同

通过控制变量实验,说明对于预测传播效率而言,节点度、介数中心性不是一个很好的指标,通过k-shell分解所得到的分层是鲁棒的指标。判断的指标是网络的感染规模。结果呈现方式为热力图。

量化各个指标在描述传播过程中的不精确度,意在说明用

来预测感染规模相对而言更为精确。可视化方式为折线图。

量化网络中所有点的传播效率,通过散点图呈现,然后选取其中传播能力最强的节点高亮,意在说明高传播能力的节点基本集中在高k-shell结构中。

选取多个节点作为传播起点,根据平均感染规模说吗对于多传播源的情况下,多个度值高的节点要比多个k-core值高的节点传播能力强。结果通过折线图呈现,并通过研究传播节点不相连的情形所造成的感染规模,推断传播节点的距离有多重要。(PS:这里并没有直接计算节点的距离,只是考虑了节点的连通性,可以实验说设计得很巧妙)

研究传播模型中的传染率参数对于实验结果的影响。是否会影响

对于预测感染规模时的鲁棒性。

五、讨论与思考

该研究没有考虑节点间的交互强度,是否节点间的交互强度对于传播而言不重要?

没有考虑网络连边的方向性,方向也不重要?

多个传播节点时,如何更加精细地考虑“传播者”的距离对于传播过程的影响?

在同一层k-shell节点中,其传播能力是否会有显著差异?如何对其传播能力进行排序?是否有必要?

在度量节点所处位置时,除了k-shell分解以外还有什么别的方法?

六、拓展阅读

《Leaders in Social Networks, the Delicious Case》

参考文献

Kitsak, Maksim, et al. "Identification of influential spreaders in complex networks." Nature Physics 6.11 (2010): 888-893.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值