无论在设计还是在应用一种算法时,我们必须了解这种算法的性能如何。我们通常最关心的是算法的运行速度,但有些时候,我们也要关心算法对内存空间的要求。
最坏情况分析法:
通常用来评判算法性能的三种情况是:最佳情况、平均情况和最坏情况。但是通常情况下,我们更关心算法在最坏情况下的性能如何。原因如下:
- 许多算法在最坏情况下执行会消耗相当长的时间。
- 考虑算法在最佳情况下的性能没有太多的意义,因为很多算法在最佳情况下的表现都相同。
- 分析算法平均情况下的性能往往不是那么容易。甚至很难去界定哪种情况叫做“平均情况”。
- 最坏情况可以告诉我们算法性能的上限。
虽然我们把最坏情况当做很多算法性能的度量,但是也有例外,有些时候我们也会用平均情况来评判算法性能。
O表示法:
O表示法是用来表示算法性能的最常见正式的标记法。它的简单规则有:
- 可以忽略常数项。常数项用O(1)表示。对某些常数c,正式的表述为:O(c)=O(1)。
- 可以忽略常数因子。对某些常数c,正式的表述为:O(cT)=cO(T)=O(T)。
- 加法运算取最大值。正是表述为:O(T1)+O(T2)=O(T1+T2)=max(O(T1),O(T2))。
- 乘法结果计算后,只需要考虑高阶项因子。正式表述为:O(T1)O(T2)=O(T1T2)。
常见的复杂度:
- O(1):从一个数据集中获取第一个元素。
- O(lg n):将一个数据集分成两半,然后将分开的每一半再分成两半,依次类推。
- O(n):遍历一个数据集
- O(nlg n):将一个数据集分成两半,然后将分开的每一半再分成两半,依次类推,在此过程中同时遍历一半数据。
- O(n^2):遍历一个数据集中每个元素的同时遍历另一个数量级相同的数据集。
- O(2^n):为一个数据集生成其可能的所有子集。
- O(n!):为一个数据集生成其可能的所有排列组合。
复杂度从低到高排列:
O(1) < O(lg n) < O(n) < O(nlg n) < O(n^2) < O(n^2 lg n) < O(n^3) < O(2^n) < O(3^n) < O(n!)