Information cascades blocking through influential nodes identification on social networks

 Abstract

  信息级联被认为是几乎所有灾难性社交网络现象的主要因素,包括病毒式营销、谣言传播、网络暴力和各种负面信息传播。一小部分节点对信息的传播具有重要影响,因此挖掘这些有影响力的节点有助于阻止信息级联。现有的影响节点识别大多依赖于拓扑特征,但它们无法同时捕获网络拓扑、用户行为和扩散过程中的信息内容,这可能导致控制性能不理想。为此,我们开发了一种基于扩展桥节点识别的阻塞信息级联的有效方法。具有相似倾向的个体决策行为有助于信息级联,但紧密的集群会阻碍级联的扩散。社交网络上具有双刃特征的网桥是传播来自不同集群的新信息的强大方式,但它们在转发信息方面较弱,这些信息在某种程度上存在风险或采用转发行为的成本较高,需要得到更高比例的邻居的支持。本文中,扩散桥和双刃桥的阈值模型已用于激发类桥节点的定义和信息级联的建模。提出了一种阻塞方法来识别网络中尽可能少的有影响力的扩展桥节点,以最大化信息级联阻塞,最后在社交网络上验证了该阻塞方法的性能。

关键词 信息级联 · 影响节点 · 用户行为 · 扩展桥节点 · 集群阻塞级联

1 Introduction

   Twitter、Facebook、微博等网络社交平台已成为信息形成的主要来源,促进了信息在日常生活中的快速传播。信息级联被认为是社交网络现象各个方面的主要因素,例如营销活动的传播、创新技术的传播、新闻中谣言的传播、仇恨和极端主义叙事的传播等。等2020)。分析、建模和指导此类级联是信息传播的基本组成部分之一,这反过来又有利于各种下游应用,例如动态信息传播模型(Watts 2002;Song 等人 2011;Zheng等人,2013;Zhang 等人,2020a,b;Meng 等人,2021)和负面信息引导控制(He 等人,2017;Wan 等人,2021;Wang 等人,2022)。

   复杂网络理论的许多研究成果表明,网络结构对网络中的各种动态行为具有重要影响。例如,网络中的密集集群可以抑制病毒的传播(Coupechoux 和 Lelarge 2014)。网络社区结构对于分析节点的通信影响具有重要意义(Zhao等,2014)。在网络拓扑中发现,少数节点对整个网络的连通性具有重要影响,网络中的信息传播主要是通过这些关键节点的转发来进行的(Lv等,2015)。2016年;廖等人。 2017)。网络中的簇结构是级联的天然屏障。当级联遇到紧密的簇时,它就会停止,这是级联停止的唯一原因(Easley and Kleinberg 2011);因此,探索拓扑特征,挖掘关键节点,进而优化网络结构是控制社交网络中信息扩散的有效合理方法之一。

   此前,一些数学模型已被用来描述社交网络中信息传播的特征。这些模型大多基于生物学中的生物传染病理论,信息在网络中传播的过程非常相似(Wang et al. 2015)。然而,人们通常不会在社交网络上单独做出决定;当很多人在场的时候,每个人都在做自己的决定。在这些情况下,人们的决策通常会受到他/她的朋友的影响。因此,早期决策的个人可以触发信息级联。倾向于相似性的个人决策将进一步增强信息级联。在极端情况下,每个人都会做其他人正在做的事情,甚至不惜放弃自己的私人信息(Easley and Kleinberg 2011)。因此,这些基于生物流行病模型的模型在社交网络中表现出一些局限性,因为它们无法表征参与信息级联中的个体决策行为。考虑个体行为的信息级联动态过程的建模和控制仍然具有挑战性。

   大多数现有的信息扩散模型都平等地对待所有信息,假设任何信息从节点 i 转发到节点 j 的概率是给定的常数。然而,用户之间的信息传播概率会因信息内容的变化而变化。让我们考虑一些现实中激励人心的例子。一个笑话或一段在线视频可以以惊人的速度传播到世界各地,而政治动员通过 Twitter 和 TikTok 的传播速度则要慢一些。扩散的阈值模型揭示了原因:社会活动往往本质上是有风险的事业,因此个人往往有更高的参与门槛。从上面的例子我们知道:(1)笑话、视频等门槛较低的信息内容,转发起来很容易、快捷,个人决策转发该信息的风险成本很低,即使参与转发信息的邻居节点比例较低; (2)政治动员或极端主义叙事等门槛较高的信息内容传播缓慢,考虑到决策的高风险成本,个人往往有较高比例的邻居支持其决策。

   综上所述,网络结构从宏观层面描述了节点的影响,复杂网络中的拓扑指标相对成熟且容易获取。然而,仅依靠网络结构并不能在微观层面描述节点对其他节点影响的形成和演化(Han et al.,2017)。在社交网络中,与仅基于网络结构的影响力节点识别相比,考虑用户行为和信息内容特征的影响力测量方法可以更好地描述节点个体之间影响力的形成和发展,特别是对于信息级联。在本文中,我们开发了一种通过保护有限影响力的桥式节点来阻止信息级联的有效方法。

这项工作的主要贡献总结如下:

• 簇阻止级联:簇可以阻止级联的传播。同一簇内的成员具有相似的行为倾向,新的行为很难从外部进入紧密的簇内。

• 动态信息级联模型(DICM):我们引入动态信息扩散概率来模拟信息级联过程。信息传播概率取决于个人决策行为。对于阈值较高的信息内容,个体决策往往与DICM中邻居的行为一致。

• 扩展桥接节点:我们基于社交网络中桥接的自然双刃特性来定义bridge_like 节点。 Bridge_like节点是桥节点的延伸,它不仅具有桥节点的双重特性,而且对信息级联具有重要影响。有影响力的bridge_like节点受到保护,使得特定阈值信息的级联最小化。

• 广泛的实验评估:基于识别的类桥节点的阻断方法对网络功能影响很小,并且通过去除影响节点,与其他典型方法相比,有效地阻断了负面信息的级联。仿真结果表明,当传播信息的阈值较高时,所提分块方法的控制效率高于双空间方法。同时,我们的阻塞方法保证了网络中85%以上的节点仍然处于连接状态,这基本上不会影响网络的功能。

   本文的其余部分组织如下。第 2 部分回顾了相关工作。第3节介绍了信息级联的过程和集群阻塞级联的理论。该方法在第 4 节中提出。 4、包括DICM模型的建立、影响力节点的识别、以及阻塞的建议方法,然后是实验结果和分析。 5.最后,教派。 6 总结本文。

2 Related work

   信息扩散控制是一个重要且具有挑战性的研究课题,吸引了大量的研究工作。在本节中,我们主要从两个方面回顾相关工作:(1)信息扩散过程的建模和(2)信息扩散过程的控制。

  针对信息扩散过程的建模,大多数学者采用独立级联(IC)模型、线性阈值(LT)模型、传染病模型(Boccalettia et al. 2006)等来对信息扩散过程进行建模。信息扩散。这些模型为信息传播建模提供了指导框架。不过,与现实世界的信息仍然存在一些差异。一方面,信息传播过程中忽视了信息内容。在现实世界中,用户具有一定的偏好,用户之间的信息扩散概率可能会因信息内容的变化而变化。例如,一个笑话或一个在线视频可以以惊人的速度传播,而政治动员在全球友谊网络中的进展则更为缓慢。另一方面,大多数现有作品很少关注用户行为在信息传播中的作用。直到达蒙发表了关于社交网络中行为传播的研究(Damon 2010),人们开始关注行为传播。张等人。 (2011)构建了基于在线社交网络的信息传播模型,模拟了信息传播过程,分析了网络中不同类型节点的行为规则。考虑到各种初始网络拓扑,Song 等人。 (2011)建立了基于元胞自动机的自适应网络病毒传播模型,研究了网络结构与传播行为之间的相互作用和影响。郑等人。 (2013)从社会强化的角度分析了在线社交网络中的信息传播问题。 Lu(2019)建立了考虑情感因素的社交网络信息传播模型。张等人。 (2020a)通过信息级联的扩散序列和拓扑研究了在线社交媒体中信息的传播模式,提出了基于层次注意力的信息级联预测模型。然而,现有的这些研究仅考虑一种机制对信息传播的影响,如传播者、网络拓扑、用户行为、信息内容等。

   事实上,信息内容和用户行为是相互关联、相互影响的。人们的许多行为都是受到相关信息的刺激。一方面,个体的行为会受到相关信息的刺激和影响。当刺激积累到一定程度时,可能会刺激个体产生相应的行为,这种信息的累积效应就是一种社会强化效应。另一方面,个体行为本身会给周围个体一种示范信息,从而刺激他人产生模仿行为。这样,信息和行为就在网络上交互和传播(Chen et al. 2015)。最近已经确定,传染病在人与人之间的传播不仅受到病原体本身的影响,而且还受到人们意识到这种流行病后的行为变化的影响,例如社交距离(Bu et al. 2013)。因此,我们结合信息内容的特点和个体决策行为,建立了信息级联的动态扩散模型。

  从信息扩散过程的控制角度来看,学者们普遍采用基于关键节点控制的方法来控制网络中的信息扩散过程。因为,人们发现少数节点对整个网络的连通性有着重要的影响,而网络中的信息传输主要是通过这些关键节点的转发来进行的(Zhao et al. 2014;Lv et al. 2016)。如果我们想要控制网络中的信息传播,我们只需要控制或保护关键节点(Zhou et al. 2019)。因此,如何寻找高影响力节点是阻断信息扩散的关键。

  网络拓扑、用户行为和信息内容构成了社交网络中信息传播的三要素。拓扑可以从宏观层面描述节点的影响力,且易于获取。复杂网络中的拓扑指标已经相对成熟(Han et al. 2017)。因此,用拓扑来衡量节点的影响力已成为一种常见的做法。从网络拓扑的角度来看,节点的度中心性、介数中心性、紧密度中心性和聚类系数可以在一定程度上表达节点的影响力。此外,Granovetterh认为弱关系比强关系更好,因为弱关系可以充当不同群体之间的“桥梁”(Granovetter 1973;Han et al. 2017)。赵等人。 (2014)利用社区划分算法对社交网络进行划分后,根据节点所连接的社区数量提出了节点的Vc指数,以进一步表征节点的影响力。然而,网络拓扑中的边连接无法描述节点之间复杂的交互关系,因为现实世界的复杂网络中节点之间存在明显的级联关系(Zhang et al. 2020ab)。

 用户行为和交互信息可以很好地反映用户影响力的形成和变化细节。网络研究预测,在社交网络中,信息内容特征更容易影响意见领袖的行为选择(Hou,2022)。社交网络中的用户发布内容信息,然后通过互动行为传播内容。通过分析这些行为,我们不仅可以衡量用户之间的影响强度,还可以预测用户行为在社交网络上的传播速度和范围(Han et al.,2017)。谭等人。 (2010)综合考虑拓扑和用户历史行为等数据来衡量邻居对用户的影响,从而预测用户行为。翔等人。 (2010)利用用户之间的交互行为和主题相似度来衡量用户之间的影响力。虽然基于用户信息和行为特征的影响力度量方法比基于拓扑的影响力度量方法能够更好地描述用户之间影响力的形成和发展(Han et al.,2017)。然而,由于信息文本的复杂性,基于用户信息的测量对数据预处理的要求较高,而基于行为特征的测量仅适用于特定网络,没有考虑全局网络结构。

   尽管这些结果发现了不同级别的高影响力节点,但仍然存在一些明显的问题。第一个问题是它们通常只考虑单一因素来衡量节点的影响力,并不能完全描述节点的影响力。第二个问题是他们忽略了控制这些节点的成本,控制这些节点可能会导致网络断开。为了克服这些限制,本文考虑是否可以结合拓扑、用户信息和行为特征的优势来识别节点的影响力,从而提出信息扩散中影响力大且控制成本低的节点。

  鉴于此,本文首先建立了动态​​信息级联模型DICM,该模型能够准确地描述现实世界中信息扩散的动态过程。然后,根据网络拓扑、信息内容和用户行为对信息扩散的影响,我们基于社交网络中桥梁的天然双刃特性定义了类桥节点。 Bridge_like节点不仅具有桥节点的双重特性,而且对信息级联具有重要影响。最后,我们开发了一种基于类桥节点识别的有效阻塞方法来抑制信息级联。

3 Preliminaries

3.1 Information cascades

  在网络环境中,人们往往会受到邻居的行为和决策的影响(Easley 和 Kleinberg 2011)。意见、产品广告、他人的政治立场以及参与的活动可以通过这种影响力的连锁反应在网络上传播,这一过程称为信息级联(Easley and Kleinberg 2011)。很多时候,人们会理性地放弃自己的选择,而追随别人的选择,这就是从众现象。整合的形成本质上植根于信息级联的思想。信息级联发生的前提是人们在不同时刻轮流做出决策,而后者可以观察前者的决策行为,并通过这些行为推断他们是否选择做出相同的决策。因此,在信息级联中,个体模仿他人的行为并不是盲目的。

   个人的选择取决于其他人在信息级联中的行为。我们使用显式网络结构来了解个体如何受到网络邻居的影响。我们与世界上其他人的许多互动往往是本地的,而不是全球的。与个人的邻居变得相似可能是由于个人在特定情况下寻求最大化其效用的行为而产生的。

图1 基于DICM模型的节点对信息级联影响的描述。 (一)红色节点表示参与信息转发的节点。 (二)蓝色(低度)、绿色(高度)、黄色(中度)节点在信息级联过程中具有不同的影响力。 (III) 这里蓝色节点只有一个额外的邻居,因此它的转发对信息级联没有贡献。绿色节点的度数较高,因此几乎不受邻居行为的影响。黄色节点不仅相对容易受到较高比例邻居行为的影响,而且能够在一定程度上影响其他邻居的选择。因此,可以推断,黄色节点可以增强信息级联,重点关注较高比例的邻居一致行为

   网络上的级联过程可能是一些不需要较高比例邻居支持的信息内容,比如一个笑话/一个在线视频,也可能是一些需要较高比例邻居支持的信息内容(图1)、如谣言。我们都知道,邻居采纳比例较高的谣言的泛滥比邻居采纳比例较低的谣言的危害更大,应该避免、克制或制止。

3.2 Cluster blocking cascades

  事实上,同质性往往会成为扩散的障碍,使创新很难从紧密联系的社区之外到来。 “密集连接的社区”的一个关键属性是,一个节点个体属于一个节点,它的许多邻居也倾向于属于一个节点。在本文中,这样的“密集连接的社区”被称为集群。集群中的每个节点也有一定比例的邻居驻留在集群中,这意味着一定程度的内部“凝聚力”。

图2 集群对信息级联影响的描述

  图 2 说明了集群对信息级联的影响。我们假设节点7和8是信息C的初始传播者,决定转发信息C的个体需要得到图2中至少40%邻居的支持。我们认为网络中的每个节点决定是否转发信息C。根据自己的决定信息。首先,节点 5 选择转发信息,因为它的 50% 邻居支持转发,并且 50% 邻居支持的比例大于给定的 40%。然后节点4和8,最后节点9和10也选择转发信息C。注意,信息C存在一个级联过程。由于信息C需要高比例的邻居支持,所以我们看到它无法传播到集群1 和簇 3。因此,我们得出结论,紧密的簇 1 和簇 3 阻碍了信息 C 的级联。这是表明簇是级联的天然障碍的精确陈述(Morris 2010)。

4 Methodology

  基于上述描述,我们总结了有效阻止社交网络中信息级联的主要挑战如下。

• 如何量化不同信息内容的影响和用户行为倾向,以便于信息级联建模?信息级联建模的关键是如何确定各个节点的行为决策规则。本文中,个体决策行为与信息内容和用户行为密切相关,因此量化信息内容和用户行为非常重要。

• 如何考虑个体的行为决策规则,建立信息级联模型来描述现实世界中信息的动态扩散过程?

• 如何识别信息级联过程中的影响节点,并在低封锁成本约束下有效封锁信息级联?

  为了应对上述三个挑战,在本节中,我们首先定义阈值和一致性比率来分别量化不同信息内容的影响和用户行为倾向。然后,我们建立动态信息级联模型来描述现实世界中信息的动态扩散过程。最后,我们定义了bridge_like节点来描述信息级联过程中的影响节点,并提出了一种基于bridge_like节点识别的有效阻塞方法来抑制信息级联。

4.1 Threshold value for information content

  关注信息内容的特征有助于分析信息传播的机制。本节中,如何量化不同信息内容对信息扩散过程的影响?我们已经知道,一个笑话或网络视频的传播速度非常快,但在关系较弱的大规模社交网络中,政治动员的进展相对缓慢。扩散的阈值模型表明,社会活动往往本质上是有风险的事业,并且个人往往有更高比例的邻居支持他们的决定。

  我们通过一个例子来观察不同信息内容的传播情况。我们假设有两种类型的信息,Cl(例如笑话或视频)和Ch(例如政治动员或极端主义叙事),分别在图2中的小网络中传播。如果节点7和8是初始的信息传播者 Cl 和 Ch。接下来我们讨论信息Cl和Ch的扩散。

• 在信息Cl的级联中,如果需要至少5%的邻居支持,则有四个步骤:首先,节点4、5、9、10和12选择转发信息Cl,然后节点6、11 、13、14、15,下一个节点2,最后节点1、3都选择转发该信息。我们看到图2中所有节点都选择转发信息,四步后扩散率达到100%。我们的结论是,诸如笑话或视频之类的信息Cl可以轻松快速地转发,即使邻居的支持比例较低,个人决策转发该信息的风险成本也较低;

• 在信息Ch的级联中,如果需要至少35%的邻居支持,则分三步:首先节点5和10选择转发信息Ch,然后节点4和9,最后节点6也选择转发信息Ch转发信息。我们看到信息 Ch 的级联停止,因为簇 1 和簇 3 阻碍了 Ch 的级联。由于转发政治言论的风险和成本较高,个人往往有较高比例的邻居节点支持其决策。我们的结论是,政治动员或极端主义叙事等信息传播缓慢,考虑到高风险行为,节点往往有更高比例的邻居支持其决策。

  这说明了两种类型的信息 Cl 和 Ch 的不同级联过程。接下来,我们定义信息内容的阈值来描述信息级联过程中不同信息内容的影响。

定义1(阈值) 信息内容的阈值q用于描述不同信息内容在信息级联过程中的难度。

信息C的阈值被记录为qC(qCε(0,1))。直观上,qC 越低,信息 C 传播得越快,也越容易闯入社交网络中新的其他集群;相反,qC 越高,信息 C 扩散越慢,并且更难闯入新的其他簇。

4.2 Consistency ratio for user behavior

  具有相似倾向的个人决策行为有助于信息级联。在本文中,个体决策行为取决于邻居的一致行为和信息内容特征。在信息的级联过程中,个体的决策不仅取决于信息的阈值,而且还受到用户行为的影响。因此,我们引入一致性比率指标来描述信息传播过程中用户行为的倾向。联系信息级联的本质,一致性比率描述了周围邻居行为的支持程度。一致性比越高,周围邻居行为的相似度越高,从而促进信息级联。接下来,我们定义用户行为的一致性比率来描述其周围邻居的行为对其决策的影响:

定义2(一致性比) 用户行为一致性比p用来表征用户周围邻居行为的相似程度,可以量化为所有邻居节点中参与转发信息的邻居所占的比例。

用户 i 的一致性比率记为 pi (pi ∈ (0,1))。 pi越大,用户i周围的邻居行为一致的比例就越大。节点忽略它们的信息并遵循邻居的行为选择,并且更容易级联信息。例如图2中,在上述信息Ch的级联中,如果节点2的p大于35%,则信息Ch将传播到集群1。

4.3 Modeling information cascades

  社交网络中的信息传播和病毒传播在网络层面上是相似的。基于流行病模型易感者-感染者-易感者(SIS),建立了动态​​信息级联模型(DICM)。在DICM中,节点状态非常简单,我们关注的是各个节点如何决定是否转发某些信息,即信息级联规律。

  在DICM中,节点状态包括S状态和I状态,分别可以用0和1表示。 S状态是不接收信息或接收信息但选择不转发信息的状态; I-state 是以下状态接收信息并选择转发信息。假设用 si(t) (si(t) ∈ Q) 来表示节点 i 在 t 时刻的状态变量,则有:

在任意时刻t,接收到信息的S状态节点都会根据p和q的值判断是否转发信息。如果p不小于q,S状态节点将选择转发信息并转向I状态。否则,S状态节点的状态不会改变。同时,I状态节点将通过恢复概率转变为S状态。 S状态和I状态之间的状态转移函数可以表示为:

其中上面的线表示相反的操作。 g是I状态和S状态之间的状态转移判断函数,可以进一步表示为:

其中 pi 表示节点 i 的一致性比率; qC表示信息C的阈值; μ为恢复率,即从I状态转变为S状态的概率; λ 是 (0,1) 之间的随机数。状态转移判断函数揭示了节点下一时刻的状态取决于节点当前时刻的状态以及其邻居节点的状态和信息内容。

  令I(t)表示在时间t选择转发信息的节点数量占网络中节点总数的比例。 I(t)的值越大,网络中信息扩散的范围越广。 S(t)表示t时刻不参与转发信息的节点比例;显然,任何时候都满足下面的方程:

因此,根据DICM模型,在每个时间步中,S状态节点都会根据邻居的状态决定是否从S状态变为I状态。同时,I状态节点可以恢复到S状态。当信息阈值给定后,进一步分析可知,节点i在t时刻的状态si(t)取决于其邻居节点当时的状态。该模型中,受信息级联中各个节点决策规则的影响,信息传播速率是动态的,与用户行为的一致性比率和信息内容的阈值密切相关。

4.4 Identifying influential nodes

  有些节点对信息的传播具有重要影响,因此挖掘这些有影响力的节点有助于阻止信息级联。从图1可以看出,与高度和低度节点相比,黄色节点(中度)是具有一定阈值的信息转发影响力的节点。他们不仅相对容易受到邻居行为的影响,而且还有大量的邻居会受到他们的决策的影响。

 扩散的阈值模型揭示了弱关系的强度(Damin 和 Michael 2007)。那些我们不常见的形成了社交网络的捷径。这说明了社交网络中桥梁的一个天然的双刃剑:它们是传播阈值较低的信息的有力方式,但在转发阈值较高的信息时却很弱,因为转发阈值较高的信息内容在社交网络中存在一定程度的风险或成本。从这个意义上说,桥节点比其各自紧密结合的集群中的其他节点具有强大的信息优势。也可以说,桥接节点很容易将阈值较低的信息传播到其他集群,但对于阈值较高的信息,它们仍然会希望与集群中的其他节点保持一致。例如,图2中的节点2和6比它们的邻居具有很强的信息优势,因为它们位于紧密集群的中间,可以促进信息级联。

  图 1 和图 2 用于激励如何在信息级联过程中找到有影响力的节点。具有双刃特性的bridge_like节点的定义如下:

定义3(bridge_like节点) Bridge_like节点是桥节点的扩展,具有桥节点的双重特征。 DICM下阈值低的信息转发能力强,阈值高的信息转发能力弱。

Bridge_like节点具有以下三个特点:

• Bridge_like节点包括桥接节点,所有桥接节点都是社交网络中的bridge_like节点。

Bridge_like 节点具有社交网络中桥梁的双刃特征。

• Bridge_like节点是中等程度的节点,在一定阈值的信息级联中相对容易受到邻居行为的影响。 

4.5 Effective blocking method

 众所周知,有影响力的节点识别问题是NP-hard问题(Morone and Makse 2015)。因此,我们提出了一种基于类桥节点识别的有效启发式阻塞方法来抑制信息级联。与传统的影响力节点识别不同,我们的方法中的影响力桥类节点识别同时捕获网络拓扑、用户行为和信息级联上的信息特征。在我们的阻塞方法中,识别有影响力的bridge_like节点的过程有三个目的。一是提高信息级联的阻塞效率。二是保证网络的连通性。三是降低阻塞成本,这也是影响力节点被识别过程中的一个重要因素。具体实施重点抓好以下几个方面。

• 为了提高阻塞效率,选择影响力较大的bridge_like节点。对bridge_like节点影响较大的是bridge_like节点的Vc指数越高,并且其邻居节点是bridge_like节点越多。

• 为保证网络的连通性,请选择中等程度的bridge_like节点。保护度数高的bridge_like节点,会使网络失去连通性,严重影响网络的基本性能。

• 为了降低阻塞成本,选择更少且更高效的bridge_like 节点。这意味着优先保护影响力较大的bridge_like节点。

  给定一个具有 n 个节点和 m 个链接的网络图 G(V, E)。我们随机选择a%节点作为初始传播者。基于bridge_like节点识别的阻塞方法的主要步骤描述如下:
步骤1:给定一个网络图G(V,E)和初始化设置;步骤2:利用经典的快速纽曼聚类算法在G中划分聚类结构;步骤3:随机选择G中的一个节点;步骤4:对于给定的阈值qC,确定该节点是否是bridge_like节点;步骤5:重复步骤3和步骤4构造节点集,并根据度中心性指标对节点集进行降序排序;步骤6:计算节点集的平均度,记为θ;步骤7:依次选择节点集中满足度值大于θ的节点;步骤8:重复步骤7,对选中的节点进行保护,直至保护节点比例达到k%;步骤4中,bridge_like节点需要满足以下方程,其中该节点的至少两个邻居节点满足方程1: 5(一):

其中ki表示节点i的度值,̄k表示网络图的平均度,q表示信息内容的阈值,Vc(i)表示节点i连接的簇的数量。

显然,基于类桥节点识别的阻塞方法是选择有限数量的有影响力的类桥节点来最大化地阻塞信息级联。当有影响力的bridge-like节点受到保护时,簇会更加紧密,具有一定阈值的新信息很难从外部进入紧密的簇,因此信息的级联被削弱和阻塞。

5 Experimental results and analysis

在本节中,我们通过将基于bridge_like节点识别的阻塞方法与典型的阻塞方法进行比较来评估受保护的有限影响节点的阻塞效率和连接效率:度中心性方法(Degree)、介数中心性方法(BC)、随机选择方法(随机),基于脆弱节点识别(MCF)的“级联故障缓解”方法(Smolyak 等人,2020)。同时,我们比较了不使用任何屏蔽方法(无策略)和上述五种屏蔽方法的负面信息扩散的屏蔽效率。

5.1 Datasets and parameters setting

5.1.1 Datasets

我们在四个真实网络上进行了对比实验,验证了基于bridge_like节点识别的阻塞方法的高效性。四个真实网络来自 Konect 的开放数据库(Koblenz 2022),分别是 Zachary 网络、小型 Facebook 网络、电子邮件网络和大型 Facebook 网络。数据集的详细描述如表1所示。

5.1.2 Parameters

  基于DICM模型,模拟实验中的回收率和阈值为μ=0.15,qC=0.20。假设随机选择 5% 的节点作为初始传播者。模拟实验中,每条曲线值代表运行50轮以上的平均值。

5.2 Blocking efficiency

  为了验证基于桥接节点识别的阻塞方法的有效性,我们描述了一段时间内决定转发信息的个体比例(I(t))的动态演变,然后分析和比较趋势相同保护节点数不同方法下的I(t)曲线。 I(t)越低,该方法的阻塞效率越好。受保护节点的比例设置为小于15%。图3显示了Zachary网络、小型Facebook网络、电子邮件网络和大型Facebook网络在应用不同阻塞方法时I(t)的变化趋势。对于Zachary网络(见图3a),基于bridge_like节点识别的阻塞方法与Degree方法和BC方法相比没有优势。合理地,最高度节点或最大介数节点的保护将使网络不连通,则划分后的Zachary网络的I(t)下降趋势优于其整个连通网络。我们可以看到,与图4a中的其他阻塞方法相比,应用bridge_like节点识别方法的Zachary网络的连通性是最优的。从图 3b-d 中小型 Facebook 网络、电子邮件网络和大型 Facebook 网络的 I(t) 变化趋势来看,基于bridge_like节点识别的阻塞方法具有明显的优势。因此,我们发表以下评论。基于bridge_like节点识别的阻塞方法优于其他典型的阻塞方法。

图3 Zachary网络不同阻塞方式下不同网络I(t)的变化趋势; b 小型 Facebook 网络; c 电子邮件网络; d 大型 Facebook 网络

5.3 Connectivity efficiency

 作为进一步的验证,我们以网络的连通效率,即网络中最大连通子图节点占总节点的比例为参考,来比较应用不同分块方法对网络基本性能的影响。如果连通性下降趋势比较明显,则说明该方法成本较高,严重影响网络的基本功能。

图 4 Zachary 网络的连通性与受不同阻塞方法保护的节点数量的关系; b 小型 Facebook 网络; c 电子邮件网络; d 大型 Facebook 网络

  在图4中,随着应用不同阻塞方法保护的节点数量的增加,连通性下降。我们看到,在图4a中,基于bridge_like节点识别的阻塞方法在小规模Zachary网络中具有明显的优势。我们的封锁方法对Zachary网络的连通性影响最小,可以保证网络的基本功能不受影响。随着图4b-d中网络规模的增加,情况变得更加复杂。从图 4b-d 可以看出,当受保护节点比例小于 15% 时,四种阻塞方法都保证网络的连通性达到 85%。然而,从上面的图3b-d我们知道,基于bridge_like节点识别的阻断方法可以更有效地阻断信息传播的速度和范围。因此,综合考虑方法的有效性和可行性,我们的方法更好。

  基于上述,我们可以得出以下结论。首先,与图3中其他典型的阻塞方法相比,基于bridge_like节点识别的阻塞方法有效地降低了速度,并以一定的阈值阻塞了信息级联的大小。其次,我们的阻塞方法保证了网络的基本性能。网络。但有些方法会导致某些网络断网。例如,在图4a中,Degree方法和BC方法使网络断开,损害了网络的基本性能。第三,我们的方法通过保护有限数量的有影响力的bridge_like节点来降低阻塞成本。并且与其他阻塞方法相比,当保护相同数量的节点时,我们的方法是最优的。

6 Conclusion

  在本文中,我们描述了信息级联,并解释了信息级联期间不同节点受到的影响。我们引入集群阻塞级联,换句话说,集群可以阻塞级联的传播。我们定义信息内容的阈值来描述不同信息内容的影响,并定义用户行为的一致性比来显示信息级联过程中周围邻居行为的趋势。建立了动态​​信息级联模型(DICM),信息扩散概率取决于DICM中的个体决策行为。基于桥的双刃性,定义了Bridge_like节点,如何找到有影响力的bridge_like节点,使得一定阈值信息的级联最小化。我们提出了一种基于bridge_like节点识别的阻塞方法,对网络性能影响很小,并且通过保护有影响力的节点,与其他典型方法相比,有效地阻塞了一定阈值的信息级联。未来,我们有兴趣探索适合更大社交网络的信息级联阻塞方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值