《复杂性思考》——利用并开发随机性的力量，将之发挥到科学预测的实际目的中去

最新推荐文章于 2024-07-31 17:25:28 发布

@wefree

最新推荐文章于 2024-07-31 17:25:28 发布

阅读量216

点赞数

分类专栏：我的算法入门文章标签：复杂性思考

本文链接：https://blog.csdn.net/qq_38672855/article/details/86502617

版权

我的算法入门专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文深入探讨复杂性科学，从科学变革的角度阐述了从经典模型到复杂模型的转变，涉及图论、算法分析、小世界图和无标度网络。重点介绍了随机图的G(n,p)模型、算法的时间和空间复杂度、小世界图的生成过程以及无标度网络的幂次定律。通过对Zipf定律、Pareto分布的讨论，揭示了复杂系统的内在规律。" 136610794,17663336,5G网络建设的最小成本光纤连接算法,"['网络', '算法', '5G', 'Python', '数据结构']

摘要由CSDN通过智能技术生成

by wefree
幕布原稿：https://mubu.com/doc/x83iAO3KQB
第一章-复杂性科学
- 科学变革
  - 经典模型——>复杂模型
  - 分析——>计算
  - 连续——>离散
  - 线性——>非线性
  - 确定——>猜测
  - 抽象——>详细
  - 一、二——>多
  - 同构——>复合
- 模型之变革
  - 预测——>解释
  - 现实主义——>工具主义
  - 简化论——>整体论
- 工程之变革
  - 集中式——>分散式
  - 隔离——>交互
  - 一对多——>多对多
  - 自上而下——>自下而上
  - 分析——>计算
  - 设计——>搜索
- 思维逻辑与认识论
  - 亚里士多德逻辑学——>多值逻辑
  - 频率论概率——>贝叶斯主义
  - 客观——>主观
  - 物理定律——>理论——>模型
  - 决定论——>非决定论
第二章-图
- 随机图
  - 经典示例：G(n,p) n表示图的节点数，p表示任意两个节点之间形成一条边的概率。
  - 有趣发现：n一定，p大于某个数值时，G很可能是连通图；否则，很可能不是。
- 迭代器
- 生成器
  - yield语句：类似return，但执行中的函数状态可以被保存下来。
  - 它是船舰迭代器的最简单方式。
第三章-算法分析
- 算法快慢不仅取决于算法本身，还取决于：1. 硬件；2. 数据的状态（比如排序的数据已经部分有序）；3. 问题大小（比如排序的数据的量级）。
- 衡量时间或空间复杂度的量级（逐渐变大）
  - O(1) ——> O(log(b)n)——>O(n)——>O(n*log(b)n)——>O(n^2)——>O(n^3)——>O(c^n)
- 排序问题经典面试回答
  - 如果实际操作中遇到这种情况。我会优先选用语言自带的排序函数；
  - 如果效率满足不了需求，我会用分析器看时间耗用在了哪儿；
  - 若情况符合且可行，我会自己使用基数排序或其它适合情况的排序方法自己写一个排序算法实现。
- Python中，大多数的字典操作与方法都只是耗费常数时间。但copy()、update()是O(n)。
- 合并列表的三种方式及其时间复杂度
  - += O(n)
  - extend方法 O(n)
  - 内建函数sum O(n^2)
- 列表推导
  - 列表推导的速度极快。因为它的循环操作是在C中，而不是在Python中运行。
  - 示例：res=[x*2 for x in t]
第四章-小世界图
- 三种图
  - 正则图特点：高聚集，高路径长度
  - 随机图特点：低聚集，低路径长度
  - 小世界图特点：高聚集，低路径长度
- 有趣发现
  - 从一个节点数为n、度为k的正则图开始，在图中选择一个边的子集，使用随机边替换掉它们以“重新连接”。重新连接的边的比例是参数p，它控制着图是有多随机。p=0时，它是正则图；p=1时，它是随即图。最终发现，p值较小时，会生成小世界图特点的图。
第五章-无标度网络
- Zipf定律
  - f=c*r^(-s) f是单词频率，r是单词名词，c、s是依赖于语言和文本的参数
- 累计分布函数（CDF）
  - CDF（x）表示数值小于等于x的概率
  - 指数分布的CDF（x）=1-e^(-λ*x)
- 累积分布函数的互补分布
  - CCDF(x)=1-CDF(x)
  - 指数分布的CCDF(x)=e^(-λ*x)
- Pareto分布
  - 1-（x/xm）^(-α) xm是最小可能值
  - 特点
    - 长尾：Pareto分布包含了许多小数值与一些非常大的数值
    - 80/20原则：分布中，大的数值非常大，大到与它们在总量中的份额不成比例。
    - 无标度：短尾分布以典型的大小为中心，称为“标度”。如人之身高的尺度是几百厘米，等等。长尾分布则没有类似的范围。
  - 应用：用以解读自然科学、社会科学的诸多领域的现象。
- 无标度网络
  - 网络中的节点的度遵循幂次定律：节点具有度k的概率P（k）～k^(-r),其中r是决定衰退率的参数。即，度的分布是无标度的网络。
- 小结
  - 本章的Zipf定律、幂次定律均可化为CDF或CCDF的数学形式。以下是这几种分布模型的不同：
    - Zipf图健壮，但只适用于离散数值
    - Pareto CCDF 健壮，且普遍性好（故此比较常用）
    - 幂次法则图噪声大
- 解释模型
  - 1. 有系统S，S中有观测物O，它对解释提供证明；
  - 2. 构建模型M去类比系统S，即：模型元素与系统元素之间是一致的；
  - 3. 通过模拟或者数学推导表明模型内能表现出一种类似O的行为B；
  - 4. 我们得出S能够表现出O的结论。
  - 这是因为S类似于M且M能表现出B，而B又类似于O。
  - 有趣的是，如果是模拟而非数学推导，那人们很可能对模型M表现出B的原因莫衷一是。
第六章-细胞自动机
- 细胞自动机（CA）
  - 第一类：从几乎任何起始条件，演进为相同的统一模式。如Rule 0;
  - 第二类：通过嵌套结构生成一种简单模式。如Rule 50、Rule 18;
  - 第三类：包含了会产生随机性的CA。如Rule 30;
  - 第四类：具有普%遍性。也称为是“图灵完备”的，这意味着它们可以计算任何可计算的函数。如Rule 110；
- 伪随机数生成器（PRNG）
- 决定论
  - D1：我可以用模型去套系统，并可以精准预测系统；
  - D2：我可以用模型去套系统，但有些系统本质是随机的；
  - D3：系统皆是“前因”推演到“后果”，但某些系统本质是随机的；
  - D4：系统皆是“前因”推演到“后果”，并可被预测（至少原理上如此）。
- Wolfram的“计算等价性原则”
  - 几乎所有不那么简单的过程都可以看作等价复杂性的计算
  - 更为具体一点，计算等价性原则表明，自然界中的系统可以将计算执行到计算能力的最高层（“通用性”），大多数系统实际上都会达到这种计算能力的最高层。因此，大多数操作系统都是计算等价的。