数据结构初阶——算法复杂度超详解

fhvyxyci

已于 2024-08-15 21:13:44 修改

阅读量1.6k

点赞数 97

分类专栏：数据结构初阶文章标签：数据结构算法

于 2024-08-15 21:12:13 首次发布

本文链接：https://blog.csdn.net/fhvyxyci/article/details/141196566

版权

数据结构初阶专栏收录该内容

10 篇文章 1 订阅

订阅专栏

1. 数据结构前言

1. 1 数据结构

数据结构是计算机存储、组织数据的方式，指相互之间存在一种或多种特定关系的数据元素的集合。没有一种单一的数据结构对所有用途都有用，所以我们要学各式各样的数据结构，
如：线性表、树、图、哈希等

1. 2 算法

算法就是定义良好的计算过程，它取一个或一组的值为输入，并产生出一个或一组值作为输出。
简单来说算法就是一系列的计算步骤，用来将输入数据转化成输出结果。

2. 算法效率

如何衡量一个算法的好坏呢?
案例：旋转数组
思路：循环K次将数组所有元素向后移动一位

如果你使用用这个代码：

void rotate(int* nums, int numsSize, int k) {
	while (k--)
	{
		//循环内部将所有元素向后移动一位
		int end = nums[numsSize - 1];
		for (int i = numsSize - 1; i > 0; i--)
		{
			nums[i] = nums[i - 1];
		}
		nums[0] = end;
	}
}

代码点击执行可以通过，然而点击提交却无法通过（超时），那该如何衡量其好与坏呢？

2. 1 复杂度的概念

算法在编写成可执行程序后，运行时需要耗费时间资源和空间(内存)资源。因此衡量一个算法的好
坏，一般是从时间和空间两个维度来衡量的，即时间复杂度和空间复杂度。

时间复杂度主要衡量一个算法的运行快慢，而空间复杂度主要衡量一个算法运行所需要的额外空间。

在计算机发展的早期，计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展，计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度（虽然话是这么说，但实际上在OJ题和面试中有很多题目都会要求空间复杂度以强迫优化算法，校验程序员的能力）。

3. 时间复杂度

定义：在计算机科学中，算法的时间复杂度是一个函数式T(N)，它定量描述了该算法的运行时间。时间复杂度是衡量程序的时间效率，那么为什么不去计算程序的运行时间呢?

因为程序运行时间和编译环境和运行机器的配置都有关系，比如同一个算法程序，用一个老编译器进行编译和新编译器编译，在同样机器下运行时间不同。
同一个算法程序，用一个老低配置机器和新高配置机器，运行时间也不同。
并且时间只能程序写好后测试，不能写程序前通过理论思想计算评估。

那么算法的时间复杂度是一个函数式T(N)到底是什么呢？
这个T(N)函数式计算了程序的执行次数。在C语言编译链接中，我们知道算法程序被编译后生成二进制指令，程序运行，就是cpu执行这些编译好的指令。那么我们通过程序代码或者理论思想计算出程序的执行次数的函数式T(N)，假设每句指令执行时间基本一样(实际中有差别，但是微乎其微)，那么执行次数和运行时间就是等比正相关。
这样也脱离了具体的编译运行环境，执行次数就可以代表程序时间效率的优劣。
比如解决一个问题的算法a程序T(N)=N，算法b程序T(N)=N^2，那么算法a的效率一定优于算法b。

举例：

//计算一下 Func1 中 ++count 语句总共执行了多少次？
void Func1(int N)
{
	int count = 0;
	for (int i = 0; i < N; ++i)
	{
		for (int j = 0; j < N; ++j)
		{
			++count;
		}
	}
	for (int k = 0; k < 2 * N; ++k)
	{
		++count;
	}
	int M = 10;
	while (M--)
	{
		++count;
	}
}

Func1 执行的基本操作次数:

T(N) = N ^ 2 + 2 * N + 10

N = 10，T(N) = 130
N = 100，T(N) = 10210
N = 1000 ，T(N) = 1002010
通过对N取值分析，对结果影响最大的一项是 N² 这一项。

实际中我们计算时间复杂度时，计算的也不是程序的精确的执行次数，精确执行次数计算起来还是很麻烦的(不同的一句程序代码，编译出的指令条数都是不一样的)，计算出精确的执行次数意义也不大，因为我们计算时间复杂度只是想比较算法程序的增长量级，也就是当N不断变大时T(N)的差别，上面我们已经看到了当N不断变大时常数和低阶项对结果的影响很小，所以我们只需要计算程序能代表增长量级的大概执行次数，复杂度的表示通常使用大O的渐进表示法。

3. 1 大O的渐进表示法

大O符号(Big O notation)是用于描述函数渐进行为的数学符号。

推导大O阶规则：

时间复杂度函数式T(N)中，只保留最高阶项，去掉那些低阶项，因为当N不断变大时，低阶项对结果影响越来越小，当N无穷大时，就可以忽略不计了。
如果最高阶项存在且不是1，则去除这个项目的常数系数，因为当N不断变大，这个系数对结果影响越来越小，当N无穷大时，就可以忽略不计了。
T(N)中如果没有N相关的项目，只有常数项，用常数1取代所有加法常数。

通过以上方法，可以得到 Func1 的时间复杂度为：O(n²)。

3. 2 时间复杂度计算示例

3. 2. 1 示例1

// 计算Func2的时间复杂度？
void Func2(int N)
{
	int count = 0;
	
	for (int k = 0; k < 2 * N; ++k)
		++count;

	int M = 10;
	
	while (M--)
		++count;
	
	printf("%d\n", count);
}

很容易知道，F(N) = 2 * N + 10 。
根据推导规则第3条得出Func2的时间复杂度为：O(N)。

3. 2. 2 示例2

// 计算Func3的时间复杂度？
void Func3(int N, int M)
{
	int count = 0;
	
	for (int k = 0; k < M; ++k)
		++count;
	
	for (int k = 0; k < N; ++k)
		++count;
	
	printf("%d\n", count);
}

Func3执行的基本操作次数：F(N) = M + N
因此，Func3的时间复杂度为：O(N)。

3. 2. 3 示例3

// 计算Func4的时间复杂度？
void Func4(int N)
{
	int count = 0;

	for (int k = 0; k < 100; ++k)
		++count;
	
	printf("%d\n", count);
}

Func4执行的基本操作次数：F(N) = 100。
根据推导规则第1条得出Func2的时间复杂度为：O(1)。

3. 2. 4 示例4

const char* strchr(const char* str, int character)
{
	const char* p_begin = str;
	while (*p_begin != character)
	{
		if (*p_begin == '\0')
			return NULL;
		p_begin++;
	}
	return p_begin;
}

这个代码我们来细致地分析一下：
这是一个在字符串中寻找特定字符的函数，如果找到了，就返回这个字符在字符串中首次出现的地址，否则返回 NULL，因此它的运行次数更加复杂，需要分类讨论：

strchr执行的基本操作次数:

若要查找的字符在字符串第一个位置，则：F(N) = 1
若要查找的字符在字符串最后的一个位置，则：F(N) = N
若要查找的字符在字符串中间位置，则：F(N) = N / 2

这也就意味着，我们不能用一个关系式表达出 strchr 这个函数的时间复杂度：

最好情况：O(1)
最坏情况：O(N)
平均情况：O(N)

通过上面这个函数我们会发现，有些算法的时间复杂度存在最好、平均和最坏情况。

最坏情况：任意输入规模的最大运行次数(上界)
平均情况：任意输入规模的期望运行次数
最好情况：任意输入规模的最小运行次数(下界)

大O的渐进表示法在实际中一般情况关注的是算法的上界，也就是最坏运行情况。

3. 2. 5 示例5

//冒泡排序
void BubbleSort(int* a, int n)
{
	assert(a);
	for (size_t end = n; end > 0; --end)
	{
		int exchange = 0;
		for (size_t i = 1; i < end; ++i)
		{
			if (a[i - 1] > a[i])
			{
				Swap(&a[i - 1], &a[i]);//Swap 函数的定义就省略了，想必各位都知道
				exchange = 1;
			}
		}
		if (exchange == 0)
			break;
	}
}

BubbleSort执行的基本操作次数:

若数组有序，则：F(N) = N
若数组有序且为降序，则：F(N) = N * (N + 1) / 2
若要查找的字符在字符串中间位置，则介于其他两种情况之间

因此，BubbleSort的时间复杂度取最差情况为：O(N²)

3. 2. 6 示例6

void func5(int n)
{
	int cnt = 1;
	while (cnt < n)
		cnt *= 2;
}

当n=2时，执行次数为 1
当n=4时，执行次数为 2
当n=16时，执行次数为4
假设执行次数为x，则 2^x = n
因此执行次数：x=logn

因此:func5的时间复杂度取最差情况为O(logn)

注意博客中和书籍中
$log_2{n},log{n},lg{n}$
的表示
当n接近无穷大时，底数的大小对结果影响不大。因此，一般情况下不管底数是多少都可以省略不写，即可以表示为 logn
不同书籍的表示方式不同，以上写法差别不大，我建议使用logn

3. 2. 7 示例7

//阶乘
long long Fac(size_t N)
{
	if (N == 0)
		return 1;
	return Fac(N - 1) * N;
}

调用一次Fac函数的时间复杂度为 O(1)
而在Fac函数中，存在n次递归调用Fac函数
因此：阶乘递归的时间复杂度为：O(n)

4. 空间复杂度

空间复杂度也是一个数学表达式，是对一个算法在运行过程中因为算法的需要额外临时开辟的空间的估算。
空间复杂度不是程序占用了多少bytes的空间，因为常规情况每个对象大小差异不会很大，所以空间复杂度算的是变量的个数。
空间复杂度计算规则基本跟实践复杂度类似，也使用大O渐进表示法。
注意：函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了，因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。

4. 1 空间复杂度计算示例

4. 1. 1 示例1

//计算BubbleSort的时间复杂度
void BubbleSort(int* a, int n)
{
	assert(a);
	for (size_t end = n; end > 0; --end)
	{
		int exchange = 0;
		for (size_t i = 1; i < end; ++i)
		{
			if (a[i - 1] > a[i])
			{
				Swap(&a[i - 1], &a[i]);
				exchange = 1;
			}
		}
		if (exchange == 0)
			break;
	}
}

函数栈帧在编译期间已经确定好了，只需要关注函数在运行时额外申请的空间。
BubbleSort额外申请的空间有exchange等有限个局部变量，使用了常数个额外空间。
因此空间复杂度为 O(1)。

4. 1. 2 示例2

// 计算阶乘递归Fac的空间复杂度
long long Fac(size_t N)
{
	if (N == 0)
		return 1;
	return Fac(N - 1) * N;
}

Fac递归调用了N次，额外开辟了N个函数栈帧，每个栈帧使用了常数个空间。
因此空间复杂度为：O(N)

这里你可能会有疑惑：为什么在冒泡排序中函数栈帧就忽略，而在递归中就要计算？
因为一个函数栈帧的空间复杂度是一个常数，在冒泡排序中只创建了一次函数栈帧，所以函数栈帧总的使用的空间为常数，忽略不计。
但在递归中，函数栈帧创建了N次，就不是常数了，所以要计算。

5. 常见复杂度对比

图源网络，通过这两张图可以很清晰地看出不同复杂度的算法的快慢，大概了解一下就好，在后续使用中会自然地加强记忆。

6.复杂度算法题——旋转数组

思路1

时间复杂度 O(n²)
循环K次将数组所有元素向后移动一位(代码不通过)

void rotate(int* nums, int numsSize, int k) {
	while (k--)
	{
		//循环内部将所有元素向后移动一位
		int end = nums[numsSize - 1];
		for (int i = numsSize - 1; i > 0; i--)
		{
			nums[i] = nums[i - 1];
		}
		nums[0] = end;
	}
}

思路2

空间复杂度 O(n)
申请新数组空间，先将后k个数据放到新数组中，再将剩下的数据挪到新数组中

void rotate(int* nums, int numsSize, int k)
{
	//这个写法在LeetCode上可以运行，但在VS上无法运行，因为这是C99引入的变长数组，VS没有相关实现
	//int newArr[numsSize];

	//在VS上可以使用动态内存管理来模拟实现变长数组
	int* newArr = (int*)malloc(sizeof(int) * numsSize);

	for (int i = 0; i < numsSize; ++i)
		newArr[(i + k) % numsSize] = nums[i];
		
	for (int i = 0; i < numsSize; ++i)
		nums[i] = newArr[i];
	
	//最后不要忘记释放空间
	free(newArr);
	newArr = NULL;
}

思路3

空间复杂度 O(1)
前n-k个逆置：4321 567

后k个逆置：4321 765

整体逆置：5671234

这样也可以实现题目要求。

void reverse(int* nums, int begin, int end)
{
	//reverse函数用来颠倒一个范围内的数组顺序
	while (begin < end) 
	{
		//下面3行是交换
		int tmp = nums[begin];
		nums[begin] = nums[end];
		nums[end] = tmp;
		
		begin++;
		end--;
	}
}
void rotate(int* nums, int numsSize, int k)
{
	k = k % numsSize;	//防止 k > numsSize 导致程序错误，k % numsSize 就是实际要转动的次数
	reverse(nums, 0, numsSize - k - 1);
	reverse(nums, numsSize - k, numsSize - 1);
	reverse(nums, 0, numsSize - 1);
}