数据结构复杂度分析

最新推荐文章于 2024-07-25 02:49:15 发布

C君莫笑

最新推荐文章于 2024-07-25 02:49:15 发布

阅读量1.1k

点赞数 1

分类专栏：数据结构快速入门

本文链接：https://blog.csdn.net/qq_34623621/article/details/126768888

版权

数据结构算法 python

数据结构快速入门专栏收录该内容

11 篇文章 3 订阅

订阅专栏

文章目录

前言
一、什么是复杂度分析？
二、为什么要进行复杂度分析？
三、如何进行复杂度分析？
- 1. 大O表示法
- 2. 复杂度分析法则
四、常用的复杂度级别？
五、不常见的时间复杂度
六、如何掌握好复杂度分析方法？
- 1. 大O标记
总结

前言

提到数据结构+算法的学习，有两个问题是不可避免的，一个是时间复杂度，可以理解为算法的运行时间，如果算法运行时间太长，那这个算法就没法用；另一个是算法的空间复杂度，可以理解为把算法存储在计算机中需要多大的空间，如果需要空间太大，那这个算法也没法用。因此，需要对一个算法的时间复杂度和空间复杂度进行分析，来确定该算法的可行性。

一、什么是复杂度分析？

数据结构和算法解决的是：如何让计算机更快时间、更省空间的解决问题。
因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。
分别用时间复杂度和空间复杂度两个概念来描述程序性能，二者统称为复杂度。
复杂度描述的是算法执行时间（或占用空间）与数据规模的增长关系。

二、为什么要进行复杂度分析？

和性能测试相比，复杂度分析有不依赖执行环境、成本低、效率高、易操作、指导性强的特点。
掌握复杂度分析，将能编写出性能更优的代码，有利于降低系统开发和维护成本。

三、如何进行复杂度分析？

1. 大O表示法

1）来源

算法的执行时间与每行代码的执行次数成正比，用T(n) = O(f(n))表示，其中T(n)表示算法执行总时间，f(n)表示每行代码执行总次数，而n往往表示数据规模。

2）特点

以时间复杂度为例，由于时间复杂度描述的是算法执行时间与数据规模的增长变化趋势，所以常量阶、低阶以及系数实际上对这种增长趋势不产决定性影响，所以在做时间复杂度分析时忽略这些项。

2. 复杂度分析法则

1）单段代码看高频：比如循环。

2）多段代码取最大：比如一段代码中有单循环和多重循环，那么取多重循环的复杂度。

3）嵌套代码求乘积：比如递归、多重循环等。

4）多个规模求加法：比如方法有两个参数控制两个循环的次数，那么这时就取二者复杂度相加。

四、常用的复杂度级别？

多项式阶：随着数据规模的增长，算法的执行时间和空间占用，按照多项式的比例增长。包括， O(1)（常数阶）、O(logn)（对数阶）、O(n)（线性阶）、O(nlogn)（线性对数阶）、O(n^2 ) （平方阶）、O( n^3)（立方阶）

非多项式阶：随着数据规模的增长，算法的执行时间和空间占用暴增，这类算法性能极差。包括， O( 2^n )（指数阶）、O(n!)（阶乘阶）

复杂度量级排序：
在这里插入图片描述

1. 常数阶O(1)

无论代码执行了多少行，其他区域不会影响到操作，这个代码的时间复杂度都是O(1)
在这里插入图片描述

void swapTwoInts(int &a, int &b)
{
	int temp = a;
	a = b;
	b = temp;
}

2. 线性阶O(n)

在这里插入图片描述
在下面这段代码，for循环里面的代码会执行 n 遍，因此它消耗的时间是随着 n 的变化而变化的，因此可以用O(n)来表示它的时间复杂度。

int sum ( int n )
{
	int ret = 0;
	for ( int i = 0 ; i <= n ; i ++)
	{
	ret += i;
	}
	return ret;
}

3. 平方阶O(n²)

当存在双重循环的时候，即把 O(n) 的代码再嵌套循环一遍，它的时间复杂度就是 O(n²) 了。
在这里插入图片描述

void selectionSort(int arr[],int n){
 	for(int i = 0; i < n ; i++){
 	int minIndex = i;
 	for (int j = i + 1; j < n ; j++ )
 		if (arr[j] < arr[minIndex])
 			minIndex = j;
 			swap ( arr[i], arr[minIndex]);
 	}
	}

这里简单的推导一下

当 i = 0 时，第二重循环需要运行 (n - 1) 次

当 i = 1 时，第二重循环需要运行 (n - 2) 次

。。。。。。

不难得到公式：

(n - 1) + (n - 2) + (n - 3) + ... + 0
= (0 + n - 1) * n / 2
= O (n ^2)

4. 对数阶O(logn)

在这里插入图片描述

 int binarySearch( int arr[], int n , int target){
 	int l = 0, r = n - 1;
 	while ( l <= r) {
 	int mid = l + (r - l) / 2;
     	if (arr[mid] == target) return mid;
    	if (arr[mid] > target ) r = mid - 1;
    	else l = mid + 1;
   }
 return -1;
}

在二分查找法的代码中，通过while循环，成 2 倍数的缩减搜索范围，也就是说需要经过 log2^n 次即可跳出循环。

五、不常见的时间复杂度

1. 最好情况时间复杂度（best case time complexity）

最好情况时间复杂度就是，在最理想的情况下，执行这段代码的时间复杂度。在最理想的情况下，要查找的变量 x 正好是数组的第一个元素，这个时候对应的时间复杂度就是最好情况时间复杂度。

2. 最坏情况时间复杂度（worst case time complexity）

最坏情况时间复杂度就是，在最糟糕的情况下，执行这段代码的时间复杂度。如果数组中没有要查找的变量 x，我们需要把整个数组都遍历一遍才行，所以这种最糟糕情况下对应的时间复杂度就是最坏情况时间复杂度。
在这里插入图片描述
最好、最坏情况时间复杂度指的是特殊情况下的时间复杂度。
动图表明的是在数组 array 中寻找变量 x 第一次出现的位置，若没有找到，则返回 -1；否则返回位置下标。

int find(int[] array, int n, int x) {
  for (  int i = 0 ; i < n; i++) {
    if (array[i] == x) {
        return i;
        break;
    }
  }
  return -1;
}

在这里当数组中第一个元素就是要找的 x 时，时间复杂度是 O(1)；而当最后一个元素才是 x 时，时间复杂度则是 O(n)。

最好情况时间复杂度就是在最理想情况下执行代码的时间复杂度，它的时间是最短的；最坏情况时间复杂度就是在最糟糕情况下执行代码的时间复杂度，它的时间是最长的。

3. 平均情况时间复杂度（average case time complexity）

最好、最坏时间复杂度反应的是极端条件下的复杂度，发生的概率不大，不能代表平均水平。那么为了更好的表示平均情况下的算法复杂度，就需要引入平均时间复杂度。

平均情况时间复杂度可用代码在所有可能情况下执行次数的加权平均值表示。

还是以 find 函数为例，从概率的角度看， x 在数组中每一个位置的可能性是相同的，为 1 / n。那么，那么平均情况时间复杂度就可以用下面的方式计算：

((1 + 2 + … + n) / n + n)  /  2 = (3n + 1) / 4

在这里插入图片描述
find 函数的平均时间复杂度为 O(n)。

4. 均摊时间复杂度（amortized time complexity）

我们通过一个动态数组的 push_back 操作来理解均摊复杂度。
在这里插入图片描述

template <typename T>
 class MyVector{
 private:
     T* data;
     int size;       // 存储数组中的元素个数
     int capacity;   // 存储数组中可以容纳的最大的元素个数
     // 复杂度为 O(n)
     void resize(int newCapacity){
         T *newData = new T[newCapacity];
        for( int i = 0 ; i < size ; i ++ ){
              newData[i] = data[i];
            }
        data = newData;
        capacity = newCapacity;
    }
public:
    MyVector(){
        data = new T[100];
        size = 0;
        capacity = 100;
    }
    // 平均复杂度为 O(1)
    void push_back(T e){
        if(size == capacity)
            resize(2 * capacity);
        data[size++] = e;
    }
    // 平均复杂度为 O(1)
    T pop_back(){
        size --;
        return data[size];
    }

};