复杂网络分析 05 无标度网络

最新推荐文章于 2025-04-04 09:28:36 发布

一个噗噗

最新推荐文章于 2025-04-04 09:28:36 发布

阅读量6.3k

点赞数 3

分类专栏：复杂网络分析北师大Mooc学习笔记文章标签：网络

本文链接：https://blog.csdn.net/qq_36926570/article/details/105068016

版权

本文深入探讨了无标度网络，重点讲解了幂律分布及其在数据拟合中的应用。介绍了BA无标度网络模型，揭示了实际网络中节点数目增长和偏好连接的重要性，并讨论了满足给定度分布的网络生成模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

05 无标度网络

二八定则：意大利经济学家Vilfredo Pareto（1848-1923）研究了个人收入的统计分布，发现少数人的收入要远大于大多数人的收入提出了著名的80/20法则,即20%的人口占据了80%的社会财富。

货币收入财富¹公司规模分布²均满足幂律分布。
无标度网络
网络的度分布为幂律分布的异类网络
$P (k) \propto k$ ^{$-\gamma$
$lnP(k)∝-\gamma$ $l n k$ (线性关系)}
实例
WWW 节点：网页连边：超链接
因特网节点：路由器连边：光缆链接³
生物系统⁴
蛋白质交互网络⁵
科学家合作网节点：科学家连边：合著关系⁶⁷
科学引文网（有向网）节点：论文连边：论文间的引用⁸
在线社区节点：在线用户连边：电子邮件联系⁹
瑞典性关系网节点：人连边：性关系¹⁰

数据分箱：所谓分箱就是对原始数据进行分组，然后对每一组内的数据进行平滑处理。常见的分箱的方式主要有等深分箱（每组数据一样多）、等宽分箱（每组区间长度一样）、用户自定义、最小熵（各分组内的数据具有最小熵）
- 平滑的方式主要有均值平滑(用组内均值来代替组内每个元素)、中间值平滑(用组内中间值来代替组内每个元素)、边界平滑(用组内离得较近的边界值来代替组内元素)
- 对数分箱对原数据进行分箱，第i个箱的宽度为 $b^i$ , b>1。例如: b=2，则第一个箱的宽度为2，第二个箱的宽度为4，第三个箱的宽度为8，……（非线性分箱）
  对于幂律分布，在做直线拟合时，采用对数分箱更能准确的估计幂指数。
幂指数估计
- 最小二乘法就是寻找最优参数 $\gamma$ 的估计值使得因变的观察值与估计值之间的离差平方和达到最小。
- 参数拟合：极大似然估计¹¹构造似然函数
  两者结果可能存在差异
累积度分布
- 累计度分布 $P_k$ 表示在网络中随机选取一个节点的度不小于k的概率，即 $P_k=$