目录
为什么需要复杂度分析?
- 执行效率是算法一个非常重要的考量指标
- 数据结构和算法本身解决的是“快”和“省”的问题,即如何让代码运行得更快,如何让代码更省存储空间
- 事后统计法有非常大的局限性
- 测试结果非常依赖测试环境
例如,硬件环境不同,处理器不同
- 测试结果受数据规模的影响很大
- 我们需要不用具体的测试数据来测试,就可以粗略估计算法执行效率的方法——时间、空间复杂度分析方法
复杂度分析
-
大 O 复杂度表示法T(n)=O(f(n))
- 用来分析算法执行效率与数据规模之间的增长关系,可以粗略地表示,越高阶复杂度的算法,执行效率越低
- 包括时间复杂度和空间复杂度
- T(n)表示代码执行的时间或者算法的存储空间
- n 表示数据规模的大小
- f(n)表示每行代码执行的次数总和
- O表示代码的执行时间或者存储空间T(n) 与 f(n) 表达式成正比
-
时间复杂度
大 O时间复杂度
表示代码执行时间随数据规模增长的变化趋势,也叫作渐进时间复杂度
下面这段非常简单的代码,求 1,2,3…n 的累加和。我们来估算一下这段代码的执行时间。
int cal(int n) {
int sum = 0;
int i = 1;
for (; i <= n; ++i) {
sum = sum + i;
}
return sum;
}
从 CPU 的角度来看,这段代码的每一行都执行着类似的操作:读数据-运算-写数据。尽管每行代码对应的 CPU 执行的个数、执行的时间都不一样,但是,我们这里只是粗略估计,所以可以假设每行代码执行的时间都一样,为 unit_time。在这个假设的基础之上,这段代码的总执行时间是多少呢?
第 2、3 行代码分别需要 1 个 unit_time 的执行时间,第 4、5 行都运行了 n 遍,所以需要 2n*unit_time 的执行时间,所以这段代码总的执行时间就是 (2n+2)*unit_time。可以看出来,所有代码的执行时间 T(n) 与每行代码的执行次数成正比,即T(n) = O(2n+2)。
当 n 很大时,你可以把它想象成 10000、100000。而公式中的低阶、常量、系数三部分并不左右增长趋势,所以都可以忽略。我们只需要记录一个最大量级就可以了,如果用大 O 表示法表示刚讲的那段代码的时间复杂度,就可以记为:T(n) = O(n)
<