cs224w-第2课:网络属性和随机图模型 之 真实世界的网络属性

上一篇博客中提到了网络属性的定义和计算方式,这一篇我们根据定义计算出真实世界的网络属性值(以MSN为例)。

1. MSN Messenger 1个月的活动数据

数据量行为
245M用户登录
180M用户参与对话
>1.3B对话次数
>255B对话信息条数

其中: M 代表 百万次,B 代表 十亿次
以用户之间至少有一条信息交换构图,可得一幅有180M个节点、1.3B条边的复杂图。

2. 网络属性

2.1 Degree Distribution

Degree Distribution
取两次对数得下图:
Log Log Degree Distribution

我的理解: 由图上可知,极少数人和超过1000个人进行了沟通,大多数人(超过99%)一个月内沟通的人数在0-100的数量范围内。

2.2 Clustering

Clustering

我的理解: MSN中平均集聚系数0.11,我感觉是不太高的,但是这个数字多少可能不具备太多含义,更多比较得可能是对比效果,结合具体的不同网络背景的对比效果。比如微信网络和微博网络。

2.3 Connected componentsConnected components

我的理解: 最大的连通子图包含了99.9%的节点,说明绝大多数人是一个团体,保持着相互联系。另外左边斜线,说明存在大量子图的节点数目集中在0-50的数量上,并且他们与社会大众并无联系。说明MSN一个月的沟通图是一个很多子网络不连通的复杂网络。

2.4 Diameter of WCC

Diameter of WCC
我的理解: MSN网络中节点之间的平均路径长度为6.6,90%的节点之间通过8跳可以到达。哈哈哈,之前是谁说通过6个人可以找到世界上任何一个人来着,那肯定不是通过一个月的MSN找到的。

2.5 小结 MSN: key network properties
属性
Degree distribution H e a v i l y , s k e w e d ; a v g . d e g r e e = 14.4 Heavily,skewed; avg.degree = 14.4 Heavily,skewed;avg.degree=14.4
Path length 6.6 6.6 6.6
Clustering coefficient 0.11 0.11 0.11
Connected components g i a n t c o m p o n e n t giant component giantcomponent

说明:
(1)节点度数分布严重倾斜,平均节点度数为14.4,即MSN中平均每个人一个月和14.4个人保持联系
(2)giant component,复杂网络中很多网络不连通

2.6 Another example:PPI Network

PPI Network
PPI Network:蛋白互作网络。

3 学习来源

感谢斯坦福CS224w 2019秋季

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值