一、复杂度分析之——2、空间复杂度

记得多吃点

已于 2024-09-08 11:25:35 修改

阅读量743

点赞数 37

分类专栏：从零开始学算法文章标签：算法 python

于 2024-08-11 18:28:22 首次发布

本文链接：https://blog.csdn.net/Lyg970112/article/details/141108726

版权

从零开始学算法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

空间复杂度

前言
一、空间复杂度是什么？
二、算法相关空间
- 1、算法在运行过程中使用的内存空间主要包括以下几种。
- 2、暂存空间可以进一步划分为三个部分。
三、推算方法
四、常见类型
五、不同复杂度代码演示
总结

前言

本文将介绍空间复杂度相关知识。
如果下面内容看不懂的话，那就先学习完数组、链表、二叉树、图…等，再返回来看这篇文章。

一、空间复杂度是什么？

空间复杂度（space complexity）是指一个算法在运算过程中要占用多少内存空间的量度，其概念与时间复杂度非常类似，只需将“运行时间”替换为“占用内存空间”。

二、算法相关空间

1、算法在运行过程中使用的内存空间主要包括以下几种。

输入空间：用于存储算法的输入数据。
暂存空间：用于存储算法在运行过程中的变量、对象、函数上下文等数据。
输出空间：用于存储算法的输出数据。
一般情况下，空间复杂度的统计范围是“暂存空间”加上“输出空间”。

2、暂存空间可以进一步划分为三个部分。

暂存数据：用于保存算法运行过程中的各种常量、变量、对象等。
栈帧空间：用于保存调用函数的上下文数据。系统在每次调用函数时都会在栈顶部创建一个栈帧，函数返回后，栈帧空间会被释放。
指令空间：用于保存编译后的程序指令，在实际统计中通常忽略不计。

三、推算方法

空间复杂度的推算方法与时间复杂度大致相同，只需将统计对象从“操作数量”转为“使用空间大小”。
而与时间复杂度不同的是，我们通常只关注最差空间复杂度。这是因为内存空间是一项硬性要求，我们必须确保在所有输入数据下都有足够的内存空间预留。

观察以下代码，最差空间复杂度中的“最差”有两层含义。

"""
1、以最差输入数据为准：当 n < 10 的时候，空间复杂度O(1)
   当 n > 10 的时候，初始化的数组 nums 占用 O(n) 空间
   因此最差空间复杂度为 O(n)
   
2、以算法运行中的峰值内存为准：例如，程序在执行最后一行之前，占用 O(1) 空间；
   当初始化数组 nums 时，程序占用 O(n) 空间，因此最差空间复杂度为 O(n)
"""
def algorithm(n: int):
    a = 0               # O(1)
    b = [0] * 10000     # O(1)
    if n > 10:
        nums = [0] * n  # O(n)

在递归函数中，需要注意统计栈帧空间。观察以下代码

def function() -> int:
    # 执行某些操作
    return 0

def loop(n: int):
    """循环的空间复杂度为 O(1)"""
    for _ in range(n):
        function()

def recur(n: int):
    """递归的空间复杂度为 O(n)"""
    if n == 1:
        return
    return recur(n - 1)

函数 loop() 和 recur() 的时间复杂度都为O( $n$ ) ，但空间复杂度不同。

函数 loop() 在循环中调用了 $n$ 次 function() ，每轮中的 function() 都返回并释放了栈帧空间，因此空间复杂度仍为O( $1$ ) 。
递归函数 recur() 在运行过程中会同时存在 $n$ 个未返回的 recur() ，从而占用O( $n$ )的栈帧空间。

四、常见类型

设输入数据大小为 $n$ ，常见的空间复杂度类型（从低到高排列）：

O( $1$ ) < O( $log_n$ ) < O( $n$ ) < O( $n^2$ ) < O( $2^n$ )

五、不同复杂度代码演示

1、常数阶O( $1$ )

常数阶常见于数量与输入数据大小 $n$ 无关的常量、变量、对象。
需要注意的是，在循环中初始化变量或调用函数而占用的内存，在进入下一循环后就会被释放，因此不会累积占用空间，空间复杂度仍为 O( $1$ )

def function() -> int:
    """函数"""
    # 执行某些操作
    return 0

def constant(n: int):
    """常数阶"""
    # 常量、变量、对象占用 O(1) 空间
    a = 0
    nums = [0] * 10000
    node = ListNode(0)
    # 循环中的变量占用 O(1) 空间
    for _ in range(n):
        c = 0
    # 循环中的函数占用 O(1) 空间
    for _ in range(n):
        function()

2、对数阶O( $log_n$ )

数阶常见于分治算法。例如归并排序，输入长度为 $n$ 的数组，每轮递归将数组从中点处划分为两半，形成高度为 $log_n$ 的递归树，使用O( $log_n$ ) 栈帧空间。

3、线性阶O( $n$ )

线性阶常见于元素数量与 $n$ 成正比的数组、链表、栈、队列等

# 例1
def linear(n: int):
    """线性阶"""
    # 长度为 n 的列表占用 O(n) 空间
    nums = [0] * n
    # 长度为 n 的哈希表占用 O(n) 空间
    hmap = dict[int, str]()
    for i in range(n):
        hmap[i] = str(i)
# 例2
def linear_recur(n: int):
    """线性阶（递归实现）"""
    print("递归 n =", n)
    if n == 1:
        return
    linear_recur(n - 1)
#此函数的递归深度为 n 即同时存在 n 个未返回的
# linear_recur() 函数，使用 O(n) 大小的栈帧空间：

4、平方阶O( $n^2$ )

平方阶常见于矩阵和图，元素数量与 $n$ 成平方关系

def quadratic(n: int):
    """平方阶"""
    # 二维列表占用 O(n^2) 空间
    num_matrix = [[0] * n for _ in range(n)]

# 下边递归函数深度为n，在每个递归函数中都初始化了一个数组，长度分别为n、 n-1 ....、2、 1 
# 平均长度为 n/2 ，因此占用O(n^2)空间

def quadratic_recur(n: int) -> int:
    """平方阶（递归实现）"""
    if n <= 0:
        return 0
    # 数组 nums 长度为 n, n-1, ..., 2, 1
    nums = [0] * n
    return quadratic_recur(n - 1)
}

5、指数阶O( $2^n$ )

指数阶常见于二叉树

#该二叉树为满二叉树，层数为n 叶子结点为2^n - 1 ，占用了O（2^n）空间

def build_tree(n: int) -> TreeNode | None:
    """指数阶（建立满二叉树）"""
    if n == 0:
        return None
    root = TreeNode(0)
    root.left = build_tree(n - 1)
    root.right = build_tree(n - 1)
    return root

总结

理想情况下，我们希望算法的时间复杂度和空间复杂度都能达到最优。然而在实际情况中，同时优化时间复杂度和空间复杂度通常非常困难。
降低时间复杂度通常需要以提升空间复杂度为代价，反之亦然。我们将牺牲内存空间来提升算法运行速度的思路称为“以空间换时间”；反之，则称为“以时间换空间”。
选择哪种思路取决于我们更看重哪个方面。在大多数情况下，时间比空间更宝贵，因此“以空间换时间”通常是更常用的策略。当然，在数据量很大的情况下，控制空间复杂度也非常重要。