求解算法的时间复杂度的具体步骤:
⑴ 找出算法中的基本语句;
算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。
⑵ 计算基本语句的执行次数的数量级;
只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次幂正确即可,可以忽略所有低次幂和最高次幂的系数。这样能够简化算法分析,并且使注意力集中在最重要的一点上:增长率。
⑶ 用大Ο记号表示算法的时间性能。
将基本语句执行次数的数量级放入大Ο记号中。
如果算法中包含嵌套的循环,则基本语句通常是最内层的循环体,如果算法中包含并列的循环,则将并列循环的时间复杂度相加。
例1:for i:= 1 to n do inc(x); for i:= 2 to n do for j:= 2 to i-1 do begin inc(x) ; a[i,j]:= x ; end; | 时间复杂度为Ο(n) 时间复杂度为O((n-1)(n-2)/2)=Ο(n^2) 则整个算法的时间复杂度为Ο(n+ n^2)=Ο(n^2) |
常见的算法时间复杂度由小到大依次为:
常数阶Ο(1)<对数阶Ο(logn)<线性阶Ο(n)<线性对数阶Ο(nlogn)<平方Ο(n^2)<立方阶Ο(n^3)<…<指数阶Ο(2^n)<阶乘阶Ο(n!)。
Ο(1)表示基本语句的执行次数是一个常数,一般来说,只要算法中不存在循环语句,其时间复杂度就是Ο(1)、Ο(logn)、Ο(n)、Ο(nlogn)、Ο(n^2)和Ο(n^3)称为多项式时间,而Ο(2^n)和Ο(n!)称为指数时间。计算机科学家普遍认为前者是有效算法,把这类问题称为P类问题,而把后者称为NP问题。
常见的不同数量级时间复杂度的性状如图1所示。
从图中可见,我们应该尽可能选用多项式阶算法,而不希望用指数阶的算法。
如何计算程序的时间复杂度呢?
例2:i:= 1; ① while (i<=n) i:= i*2; ② | ①的频度是1,设②的频度是f(n),则2^f(n)<= n ;f(n)<= log2n,取最大值f(n)= log2n , 时间复杂度为O(log2n) |
法则1——嵌套循环语句
从里向外分析这些循环。一组嵌套循环内部的一条语句总的运行时间为该语句的运行时间乘以该组所有的循环的大小的乘积
例3:for i:= 0 to n do for j:= 0 to n-1 do begin a[i]:= a[j]+i+j; end; | 时间复杂度为Ο(n^2) |
法则2——分支语句
一个分支结构语句的运行时间从不超过条件判断所用时间加上个分支语句中运行时间长者的和。
例4:if condition S1 else S2 | 时间复杂度为条件判断所用时间加上S1和S2中运行时间较长者的总运行时间 |
法则3——循环语句
一次循环的运行时间至多是该循环语句的运行时间乘以循环的次数。
法则4——顺序语句
将各个语句的运行时间求和即可(这意味着,其中的最大值就是所得的运行时间)。如例1。
显然,在某些情况下这么估计有些过高,但绝对不会估计过低。实际上如果没有特殊说明,算法的时间复杂度一般是指最坏情况下的复杂度。
除了以上法则外还有其他的方法,算法时间复杂度的分析策略都是从内部(最深层部分)向外展开,如果有过程或函数调用,那么这些调用要首先分析,如果程序中有递归,那就要具体情况具体分析了。
情况一:
例5:function factorial(n:integr):longint; begin if n<= 1 then factorial:= 1 else factorial:= n*factorial(n-1) ; end; | 这个求N!的函数的时间复杂是O(n!) |
情况二:
例6:function factorial(n:integr):longint; begin if n<= 1 then factorial:= 1 else factorial:= factorial(n-1)+factorial(n-2) ; end; | 递归算法在大多数时候将其转换成一个简单的循环结构式是相当困难的,这时就要具体问题具体分析。这个斐波那契数函数算法的时间复杂度高得吓人,为O(2^n) |
我们还应该区分算法的最坏情况的行为和期望行为。如快速排序的最坏情况运行时间是O(n^2),但期望时间是O(nlogn)。通过每次都仔细地选择基准值,我们有可能把平方情况 (即O(n^2)情况)的概率减小到几乎等于0。在实际中,精心实现的快速排序一般都能以 (O(nlogn)时间运行。
下面是一些常用的记法:
访问数组中的元素是常数时间操作,或说O(1)操作。一个算法如果能在每个步骤去掉一半数据元素,如二分检索,通常它就取O(log2n)时间。用strcmp比较两个具有n个字符的串需要O(n)时间 。常规的矩阵乘算法是O(n^3),因为算出每个元素都需要将n对 元素相乘并加到一起,所有元素的个数是n^2。
指数时间算法通常来源于需要求出所有可能结果。例如,n个元素的集合共有2^n个子集,所以要求出所有子集的算法将是O(2^n)的 。指数算法一般说来是太复杂了,除非n的值非常小,因为,在这个问题中增加一个元素就导致运行时间加倍。不幸的是,确实有许多问题 (如著名 的“巡回售货员问题” ),到目前为止找到的算法都是指数的。如果我们真的遇到这种情况, 通常应该用寻找近似最佳结果的算法替代之。
通过学习以上各种方法以后,我们估计算法的时间复杂度就不是很困难了。而在竞赛时是要求1秒钟出结果,那具体什么样的数据规模可以在1秒内出答案呢?一般来说,10^6的数据规模都可以稳过。也就是说,当n=1000时,一般就要用O(n^2)的算法;当n=100时,一般是用O(n^3)的算法;当n=10^4或10^5时,一般是用O(nlog2n)的算法;当n是一个很小的数据的时候,可以考虑n!或2^n;而10^7~10^9就要看程序的常数了,常数小可以过,常数大就不一定能过了,视情况而定。