1. 算法效率
1.1 复杂度的概念
算法在编写成可执行程序后,运行后需要耗费时间资源和空间资源(内存)。因此,衡量一个算法好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。早期,计算机储存容量很小,所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机储存容量已经达到了很高的程度。所以现今已不再特别关注一个算法的空间复杂度。
2. 时间复杂度
定义:在计算机科学中,算法的时间复杂度是一个函数式T(N),它定量描述了该算法的运行时间。时间复杂度是衡量程序的时间效率,为何不去程序运行的时间呢?
- 因为程序运行时间和编译环境和机器的配置都有关系,同一个算法程序,用老版本的编译程序,和新版本编译器编译,在同样机器下运行时间不同。
- 同一算法程序,用一个低配置和一个高配置机器,运行时间也不同。
- 时间只能在程序写好后测试,不能在写程序前通过理论思想计算评估。
那么T(N)到底是什么呢?它计算了程序的执行次数。我们知道,算法程序被编译后生成二进制指令,程序运行,就是CPU执行这些编译好的指令。假设每条程序执行时间基本一样(实际上有差别,可忽略不计),那么执行次数和运行时间成正比,那么也就脱离了具体的编译运行环境。执行次数就可以代表程序时间效率的优劣(为达到同一目的,哪种算法算的少哪种算法就优)。如:算法a程序T(N) = N,算法b程序T(N) = N^2,那么算法a效率一定优于算法b。
大家看下面一组代码:
不难看出,test执行的基本操作数为:
T(N) = N^2 + 2*N +10
- N = 10 T(N) = 130
- N = 100 T(N) = 10210
- N = 1000 T(N) = 1002010
可以看出,当N越开越大的时候,对结果影响最大的一项是N^2(为高阶项),当N无穷大的时候2*N和10可以忽略不计。
实际中,当我们计算时间复杂度时,计算的也不是程序的精确执行次数,并且很麻烦(不同的代码,编译出的指令条数是不一样的),意义也不大,因为我们计算时间复杂度只是想比较算法程序的增长量级,也就是当N不断变大时T(N)的差别,上面我们已经看到当N不断变大时常数和低阶项对结果的影响很小,所以我们只计算程序能代表增长量级的大概执行次数,复杂度的表示通常用大O的渐进表示法。
2.1 大O的渐进表示法
大O符号(Big O nation):是用于描述函数渐进行为的数字符号
推导大O阶进阶规则
- 时间复杂度函数式T(N)中,只保留最高阶项,去掉那些低阶项,因为当N不断变大时,低阶项对结果影响越来越小,当N无穷大时,就可以忽略不计了。
- 如果最高阶存在且不是1,则去除1这个项目的常数系数,因为当N不断变大,这个系数对结果影响越来越小,当N无穷大时,就可以忽略不计了(系数不管多大的,就算是10亿也忽略,在无穷大面前都是小数字)。
- T(N) 中如果没有N相关的项目,只有常数项,用常数1取代所有加法常数。
2.2 时间复杂度计算示例
示例1:
test2执行的基本操作次数:
T(N) = 2N + 10
根据推导规则第三条指出:test2 的时间复杂度为O(N)。
示例2:
test3执行的基本操作数为:
T(N) = M + N
因此:test3的时间复杂度为:O(N)
示例3:
test4执行的基本操作数为:
T(N) = 100
根据推导规则第一条指出
test4的时间复杂度为:O(1)
示例4:
test5执行的基本操作次数:
1)若要查找的字符在字符串的第一个位置,则:
T(N) = 1
2)若要查找的字符在字符串的最后一个位置,则:
T(N) = N
3)若要查找的字符在字符串中间位置,则:
T(N) = 0.5N
因此:test5的时间复杂度为:
最好情况:O(1)
最坏情况:O(N)
平均情况:O(N)
总结:
通过上面我们发现,有些算法的时间复杂度存在最好,平均和最坏情况。最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望次数
最好情况:任意输入规模的最小运行次数(下界)
大O的渐进表示法在实际中一般关注的是算法的上界,也就是最坏的运行情况。
示例5:
1)若属组有序,则:
T(N) = N
2)若数组有序且为降序,则:
T(N) = N*(N-1)/2
因此:test6的时间复杂度取得最差情况为:O(N^2)
示例6:
当 n=2时,执行次数为1
当 n=4时,执行次数为2
当 n=16时,执行次数为4
假设执行次数为x,则2^x = n
因此:test7得时间复杂度取得最差情况为:
O(log 2 n) (2为底数,n为指数)
注意本文和书籍中log2 n、log n、lg n 的表示
当n接近无穷大时,底数的大小对结果影响不大。因此,一般情况下不管底数是多少都可以忽略不写,即可以表示为log n
不同书籍的表示方式不同,以上写法差别不大,我们建议用log n。
示例7:
调用一次test7函数的时间复杂度为O(1)
而在test7函数中,存在n次递归调用函数,因此
阶乘递归的时间复杂度为:O(n)