空间复杂度
前言
- 本文将介绍空间复杂度相关知识。
- 如果下面内容看不懂的话,那就先学习完数组、链表、二叉树、图…等,再返回来看这篇文章。
一、空间复杂度是什么?
- 空间复杂度(space complexity)是指一个算法在运算过程中要占用多少内存空间的量度,其概念与时间复杂度非常类似,只需将“运行时间”替换为“占用内存空间”。
二、算法相关空间
1、算法在运行过程中使用的内存空间主要包括以下几种。
- 输入空间:用于存储算法的输入数据。
- 暂存空间:用于存储算法在运行过程中的变量、对象、函数上下文等数据。
- 输出空间:用于存储算法的输出数据。
一般情况下,空间复杂度的统计范围是“暂存空间”加上“输出空间”。
2、暂存空间可以进一步划分为三个部分。
- 暂存数据:用于保存算法运行过程中的各种常量、变量、对象等。
- 栈帧空间:用于保存调用函数的上下文数据。系统在每次调用函数时都会在栈顶部创建一个栈帧,函数返回后,栈帧空间会被释放。
- 指令空间:用于保存编译后的程序指令,在实际统计中通常忽略不计。
三、推算方法
-
空间复杂度的推算方法与时间复杂度大致相同,只需将统计对象从“操作数量”转为“使用空间大小”。
-
而与时间复杂度不同的是,我们通常只关注最差空间复杂度。这是因为内存空间是一项硬性要求,我们必须确保在所有输入数据下都有足够的内存空间预留。
观察以下代码,最差空间复杂度中的“最差”有两层含义。
"""
1、以最差输入数据为准:当 n < 10 的时候,空间复杂度O(1)
当 n > 10 的时候,初始化的数组 nums 占用 O(n) 空间
因此最差空间复杂度为 O(n)
2、以算法运行中的峰值内存为准:例如,程序在执行最后一行之前,占用 O(1) 空间;
当初始化数组 nums 时,程序占用 O(n) 空间,因此最差空间复杂度为 O(n)
"""
def algorithm(n: int):
a = 0 # O(1)
b = [0] * 10000 # O(1)
if n > 10:
nums = [0] * n # O(n)
在递归函数中,需要注意统计栈帧空间。观察以下代码
def function() -> int:
# 执行某些操作
return 0
def loop(n: int):
"""循环的空间复杂度为 O(1)"""
for _ in range(n):
function()
def recur(n: int):
"""递归的空间复杂度为 O(n)"""
if n == 1:
return
return recur(n - 1)
函数 loop() 和 recur() 的时间复杂度都为O( n n n) ,但空间复杂度不同。
- 函数 loop() 在循环中调用了 n n n次 function() ,每轮中的 function() 都返回并释放了栈帧空间,因此空间复杂度仍为O( 1 1 1) 。
- 递归函数 recur() 在运行过程中会同时存在 n n n个未返回的 recur() ,从而占用O( n n n)的栈帧空间。
四、常见类型
设输入数据大小为 n n n,常见的空间复杂度类型(从低到高排列):
O( 1 1 1) < O( l o g n log_n logn) < O( n n n) < O( n 2 n^2 n2) < O( 2 n 2^n 2n)
五、不同复杂度代码演示
1、常数阶O( 1 1 1)
- 常数阶常见于数量与输入数据大小 n n n无关的常量、变量、对象。
- 需要注意的是,在循环中初始化变量或调用函数而占用的内存,在进入下一循环后就会被释放,因此不会累积占用空间,空间复杂度仍为 O( 1 1 1)
def function() -> int:
"""函数"""
# 执行某些操作
return 0
def constant(n: int):
"""常数阶"""
# 常量、变量、对象占用 O(1) 空间
a = 0
nums = [0] * 10000
node = ListNode(0)
# 循环中的变量占用 O(1) 空间
for _ in range(n):
c = 0
# 循环中的函数占用 O(1) 空间
for _ in range(n):
function()
2、对数阶O( l o g n log_n logn)
- 数阶常见于分治算法。例如归并排序,输入长度为 n n n的数组,每轮递归将数组从中点处划分为两半,形成高度为 l o g n log_n logn的递归树,使用O( l o g n log_n logn) 栈帧空间。
3、线性阶O( n n n)
- 线性阶常见于元素数量与 n n n成正比的数组、链表、栈、队列等
# 例1
def linear(n: int):
"""线性阶"""
# 长度为 n 的列表占用 O(n) 空间
nums = [0] * n
# 长度为 n 的哈希表占用 O(n) 空间
hmap = dict[int, str]()
for i in range(n):
hmap[i] = str(i)
# 例2
def linear_recur(n: int):
"""线性阶(递归实现)"""
print("递归 n =", n)
if n == 1:
return
linear_recur(n - 1)
#此函数的递归深度为 n 即同时存在 n 个未返回的
# linear_recur() 函数,使用 O(n) 大小的栈帧空间:
4、平方阶O( n 2 n^2 n2)
- 平方阶常见于矩阵和图,元素数量与 n n n成平方关系
def quadratic(n: int):
"""平方阶"""
# 二维列表占用 O(n^2) 空间
num_matrix = [[0] * n for _ in range(n)]
# 下边递归函数深度为n,在每个递归函数中都初始化了一个数组,长度分别为n、 n-1 ....、2、 1
# 平均长度为 n/2 ,因此占用O(n^2)空间
def quadratic_recur(n: int) -> int:
"""平方阶(递归实现)"""
if n <= 0:
return 0
# 数组 nums 长度为 n, n-1, ..., 2, 1
nums = [0] * n
return quadratic_recur(n - 1)
}
5、指数阶O( 2 n 2^n 2n)
- 指数阶常见于二叉树
#该二叉树为满二叉树,层数为n 叶子结点为2^n - 1 ,占用了O(2^n)空间
def build_tree(n: int) -> TreeNode | None:
"""指数阶(建立满二叉树)"""
if n == 0:
return None
root = TreeNode(0)
root.left = build_tree(n - 1)
root.right = build_tree(n - 1)
return root
总结
- 理想情况下,我们希望算法的时间复杂度和空间复杂度都能达到最优。然而在实际情况中,同时优化时间复杂度和空间复杂度通常非常困难。
- 降低时间复杂度通常需要以提升空间复杂度为代价,反之亦然。我们将牺牲内存空间来提升算法运行速度的思路称为“以空间换时间”;反之,则称为“以时间换空间”。
- 选择哪种思路取决于我们更看重哪个方面。在大多数情况下,时间比空间更宝贵,因此“以空间换时间”通常是更常用的策略。当然,在数据量很大的情况下,控制空间复杂度也非常重要。