上一篇博客中提到了网络属性的定义和计算方式,这一篇我们根据定义计算出真实世界的网络属性值(以MSN为例)。
1. MSN Messenger 1个月的活动数据
数据量 | 行为 |
---|---|
245M | 用户登录 |
180M | 用户参与对话 |
>1.3B | 对话次数 |
>255B | 对话信息条数 |
其中: M 代表 百万次,B 代表 十亿次
以用户之间至少有一条信息交换构图,可得一幅有180M个节点、1.3B条边的复杂图。
2. 网络属性
2.1 Degree Distribution
取两次对数得下图:
我的理解: 由图上可知,极少数人和超过1000个人进行了沟通,大多数人(超过99%)一个月内沟通的人数在0-100的数量范围内。
2.2 Clustering
我的理解: MSN中平均集聚系数0.11,我感觉是不太高的,但是这个数字多少可能不具备太多含义,更多比较得可能是对比效果,结合具体的不同网络背景的对比效果。比如微信网络和微博网络。
2.3 Connected components![Connected components](https://i-blog.csdnimg.cn/blog_migrate/29f074ce54d1e66e4916a6176f9be260.png)
我的理解: 最大的连通子图包含了99.9%的节点,说明绝大多数人是一个团体,保持着相互联系。另外左边斜线,说明存在大量子图的节点数目集中在0-50的数量上,并且他们与社会大众并无联系。说明MSN一个月的沟通图是一个很多子网络不连通的复杂网络。
2.4 Diameter of WCC
我的理解: MSN网络中节点之间的平均路径长度为6.6,90%的节点之间通过8跳可以到达。哈哈哈,之前是谁说通过6个人可以找到世界上任何一个人来着,那肯定不是通过一个月的MSN找到的。
2.5 小结 MSN: key network properties
属性 | 值 |
---|---|
Degree distribution | H e a v i l y , s k e w e d ; a v g . d e g r e e = 14.4 Heavily,skewed; avg.degree = 14.4 Heavily,skewed;avg.degree=14.4 |
Path length | 6.6 6.6 6.6 |
Clustering coefficient | 0.11 0.11 0.11 |
Connected components | g i a n t c o m p o n e n t giant component giantcomponent |
说明:
(1)节点度数分布严重倾斜,平均节点度数为14.4,即MSN中平均每个人一个月和14.4个人保持联系
(2)giant component,复杂网络中很多网络不连通
2.6 Another example:PPI Network
PPI Network:蛋白互作网络。