前言
本文作文学习极客时间课程《数据机构与算法之美》课程的一些笔记与感悟。有兴趣的朋友希望大家关注课程。非常好的课程,不要惧怕数据结构与算法。当你学完整篇专栏,会对你整个职业生涯有比较深远的影响:加油!!!
一、什么是复杂度分析:
首先复杂度分析是针对一段程序分析的一种方法论,复杂度从两个角度去分析。一个执行效率。一个是资源消耗,用于分析程序执行效率的方法叫做"时间复杂度",分析程序消耗空间的方法叫做"空间复杂度",分别描述了程序执行时间(或占用的空间)随数据规模的增长关系。
二、为什么要进行复杂度分析?
一个数据结构和算法的好坏,评判的标准可能会受到很多环境因素的影响。验证环境的CPU,内存资源不一样,验证的数据规模的不一样。所得到的结果是不一样的。所以我们就需要一个不用具体的测试数据来测试,就可以粗略的估计算法执行效率的方法。这就是我们对算法需要进行复杂度分析的原因。
三、如何进行复杂度分析?
时间复杂度
我们对如下代码进行复杂度分析
int cal(int n) {
int sum = 0;
int i = 1;
for (; i <= n; ++i) {
sum = sum + i;
}
return sum;
}
从 CPU 的角度来看,这段代码的每一行都执行着类似的操作:读数据-运算-写数据。尽管每行代码对应的 CPU 执行的个数、执行的时间都不一样,但是,我们这里只是粗略估计,
所以可以假设每行代码执行的时间都一样,为 unit_time。在这个假设的基础之上,这段代码的总执行时间是多少呢?
第 2、3 行代码分别需要 1 个 unit_time 的执行时间,第 4、5 行都运行了 n 遍,所以需要 2n*unit_time 的执行时间,所以这段代码总的执行时间就是 (2n+2)*unit_time。
可以看出来,所有代码的执行时间 T(n) 与每行代码的执行次数成正比。
这就是大 O 时间复杂度表示法。大 O 时间复杂度实际上并不具体表示代码真正的执行时间,而是表示代码执行时间随数据规模增长的变化趋势,所以,也叫作渐进时间复杂度(asymptotic time complexity),简称时间复杂度。
时间复杂度分析的技巧:
1.只关注执行次数最多的一段代码?
比如循环。
2.加法法则:总复杂度等于量级最大的那段代码的复杂度:
比如一段代码中有单循环和多重循环,那么取多重循环的复杂度。
抽象公式:
如果 T1(n)=O(f(n)),T2(n)=O(g(n));那么 T(n)=T1(n)+T2(n)=max(O(f(n)), O(g(n))) =O(max(f(n), g(n))).
3.乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
比如递归、多重循环等
4.多个规模求加法:
比如方法有两个参数控制两个循环的次数,那么这时就取二者复杂度相加。
空间复杂度
时间复杂度的全称是渐进时间复杂度,表示算法的执行时间与数据规模之间的增长关系。类比一下,空间复杂度全称就是渐进空间复杂度(asymptotic space complexity),表示算法的存储空间与数据规模之间的增长关系。
void print(int n) {
int i = 0;
int[] a = new int[n];
for (i; i <n; ++i) {
a[i] = i * i;
}
for (i = n-1; i >= 0; --i) {
print out a[i]
}
}
跟时间复杂度分析一样,我们可以看到,第 2 行代码中,我们申请了一个空间存储变量 i,但是它是常量阶的,跟数据规模 n 没有关系,所以我们可以忽略。第 3 行申请了一个大小为 n 的 int 类型数组,除此之外,剩下的代码都没有占用更多的空间,所以整段代码的空间复杂度就是 O(n)。
我们常见的空间复杂度就是 O(1)、O(n)、O(n2 ),像 O(logn)、O(nlogn) 这样的对数阶复杂度平时都用不到。而且,空间复杂度分析比时间复杂度分析要简单很多。所以,对于空间复杂度,掌握刚我说的这些内容已经足够了
四、常用的复杂度级别:
多项式阶:随着数据规模的增长,算法的执行时间和空间占用,按照多项式的比例增长。包括, O(1)(常数阶)、O(logn)(对数阶)、O(n)(线性阶)、O(nlogn)(线性对数阶)、O(n^2)(平方阶)、O(n^3)(立方阶)
非多项式阶:随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括, O(2^n)(指数阶)、O(n!)(阶乘阶)