用R语言对网络数据进行统计分析(五)

本文介绍了使用R语言对网络数据进行统计分析,包括网络图特征的描述性统计,如顶点的度数、中心性、边的描述等。通过空手道俱乐部和酵母蛋白质相互作用网络的例子,展示了顶点度数的频率分布、中心性概念(接近中心性、中间中心性、特征向量中心性)以及网络凝聚力的度量,如子图统计、密度和相关性分析。
摘要由CSDN通过智能技术生成

R语言社交网络快速入门(一)(7天入门社交网络)
R语言社交网络快速入门(二)(7天入门社交网络)
R语言社交网络快速入门(三)(7天入门社交网络)
R语言社交网络快速入门(四)(7天入门社交网络)
R语言社交网络快速入门(五)(7天入门社交网络)

网络图特征的描述性统计

简介

在对给定的复杂系统的研究中,利益问题通常可以用作为对相应的网络图的结构或特征的某些方面的问题的方式来重新表述。例如,各种类型的基本社会动力学可以用三重顶点来表示;涉及信息或商品的移动的问题通常对应网络图的路径,沿着这些路径流动;对于单个系统元素的’重要性’的某些概念,可以通过’中心’对应网络的顶点;一个系统中搜索’社区’和类似类型的未指定的’组’通常可以作为一个图分区问题来解决。

在传统中,网络图的结构性分析主要作为一种描述性任务来处理,而不是推理任务,而用于此类目的的工具主要来自’主流’统计之外的领域。例如,这些工具中绝大部分是来自于图论和计算机科学。同样的,社会网络分析领域也是另一个重要来源,提供了用以获取社会结构和动态网络的基本面。最近,在物理学领域,尤其是在统计力学,新的工具被大量挖掘。

顶点和边的属性

由于网络图的基本元素是它们的顶点和边,因此有许多以这些为中心的网络特征。我们在这一节讨论了几个这样的描述。我们的展示是根据顶点度和那些一些更基本的概念(通常是顶点的中心度量)的特征来分解的。我们将探讨从顶点到边的规则扩展。

顶点的度数

这里我们用之前空手道的数据集举例。
这里写图片描述

左图是度数的频率分布图,右图是强度的频率分布图。强度又被称为加权度数,顾名思义它是每个顶点邻近边的加权平均。这两张图都反映了空手道分裂成两派后,教练和管理者的频率和接近,其他的都是会员,强度图会更加明显。

再来看一下 在酵母中蛋白质对之间的相互作用网络
这里写图片描述
从右边的图中可以看出,对数频率作为对数度函数存在一个相当线性的衰减。虽然我们可以用一个简单的线性归回得出一个简单的衰变率,但在这里举例,说明我们可以用一个稍复杂一点的方法得出更好的结论。

这里写图片描述
除了度数分布本身,了解不同度数顶点之间联系是很有趣的,这导致我们给出了一个顶点的邻接平均度的概念。如上图所示,一个酵母的平均邻接度与顶点度的数据。表明了,虽然高度数的顶点更倾向于与他相似的顶点,低度数的顶点则与两者都保持了密切的关联。

中心性

这里我们引入三个不同的中心概念及其定义。
Closeness centrality 用来描述一个顶点与其他所有顶点的一种中心性。我们定义顶点v的中心性是他到其他顶点距离和的倒数。

cCl(v)=1uVdist(v,u) c C l ( v ) = 1 ∑ u ∈ V d i s t ( v , u )

Betweenness centrality 基于两点来描述的中心性,其中 σ(s,t) σ ( s , t ) 表示的是节点s和t之间的最短路径的数量,而 σ(s,t|v) σ ( s , t | v ) 是最短路径中经过节点v的数量

cB(v)=stvVσ(s,t|v)σ(s,t) c B ( v ) = ∑ s ≠ t ≠ v ≠ V σ ( s , t | v ) σ ( s , t )

Eigencentrality centrality 使用邻接矩阵来寻找特征向量的中心性

  • 4
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值