知识点目录
复杂度分析
数据结构和算法的本质就是解决“快”和“省”的问题,即如何让代码运行得更快,如何让代码更省内存空间的问题。因此执行效率就是算法一个非常重要的考量指标。而时间、空间复杂度就是用来衡量算法执行效率的。因此复杂度分析是整个算法学习的精髓,只要掌握了它,数据结构和算法的内容基本上就掌握了一半。
1. 为什么需要复杂度分析?
实际上我们将代码跑一遍,通过监控、统计,就能准确地知道执行时间和占用的内存大小。这种方法叫作“事后统计法”。既然有了这种方法,那么为什么还要时间、空间复杂度分析呢?因为“事后统计法”有很多的局限性:
(1) 测试结果非常依赖测试环境
测试结果非常依赖硬件。同样的代码分别在Intel i9处理器和Intel i3处理器上运行,肯定是i9
比i3的执行速度要快很多。还有原本在这台机器上a代码执行的速度要比b代码块,但放到另一台机
器时,可能就会出现截然相反的结果。
(2) 测试结果受数据规模的影响
同一个排序算法,不同的数据排序,执行时间就会很大的差别。极端情况下,如果数据已经是有序
的,那排序算法不需要做任何操作,执行时间就会非常短。另外,如果测试数据规模太小,测试结果
可能无法真实地反应算法的性能。比如:小规模的数据排序,插入排序可能会比快速排序要快。
综上,我们需要一个不用具体的测试数据来测试,就可以粗略地计算出执行效率的方法—时间、空间复杂度分析法。
2. 大O复杂度表示法
算法的执行效率就是在不运行代码的情况下,直接就可以粗略计算出代码的执行时间。
下面我们先尝试计算出下面这段代码的执行时间:
int cal(int n) {
int sum = 0; ------1个unit_time
int i = 1; ------1个unit_time
for (; i <= n; ++i) { ------n个unit_time
sum = sum + i; ------n个unit_time
}
return sum;
}
尽管每行代码对应的CPU执行的个数、执行的时间都不一样,但我们这里只是粗略地计算,所以假设每行代码执行的时间都一样,为unit_time。在这个假设的前提下,上面这段代码的执行总时间可以按照如下计算:
第2、3行代码分别需要执行1个unit_time的执行时间,第4、5行都执行了n遍,所以都需要n个
unit_time的执行时间,所以这段代码总执行时间就是(2+2n)*unit_time。可以看出所有代码的
执行时间T(n)与每行代码执行次数成正比。
按照上面的分析思路,继续计算出下面代码的执行时间:
int cal(int n) {
int sum = 0; ------1个unit_time
int i = 1; ------1个unit_time
int j = 1; ------1个unit_time
for (; i <= n; ++i) { -