复杂度分析(上):如何分析、统计算法的执行效率和资源消耗
数据结构和算法本身解决的是“快”和“省”的问题,即如何让代码运行地更快,如何让代码更省存储空间。
一、为什么需要复杂度分析
- 测试结果非常依赖测试环境
- 测试结果受数据规模的影响很大
二、大O复杂度表示法
算法的执行效率,粗略的讲,就是算法代码执行的时间。
估算这段代码的执行时间。
int cal(int n){
int sum = 0;
int i = 1;
int j = 1;
for ( ; i<=n; ++i){
for ( ;, j<=n; ++j){
sum = sum + i * j;
}
}
return sum;
}
整段代码总的执行时间T(n) = (2n^2 + 2n + 3)*unit_time。
所有代码的执行时间T(n)与每行代码的执行次数n成正比。T(n) = O(f(n))。
T(n)表示执行代码的时间;n表示数据规模的大小;f(n)表示每行代码执行的次数综合。公式中的O表示代码执行时间T(n)与f(n)表达式成正比。
所以这个例子中T(n) = O(2n^2 + 2n + 3)。
这就是大O时间复杂度表示法。大O时间复杂度实际上并不具体代表代码真正的执行时间,而是代表代码执行时间随数据规模增长的变化趋势,所以,也叫做渐进时间复杂度。
三、时间复杂度分析
- 只关注循环执行次数最多的一段代码
- 加法法则:总复杂度等于量级最大的那段代码的复杂度
- 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
四、几种常见时间复杂度
常量阶:O(1) 指数阶:O(2^n) 对数阶:O(logn) 阶乘阶:O(n!)
线性阶:O(n) 线性对数阶O(nlogn) 平方阶:O(n^2)、立方阶:O(n^3)、、、k次方阶O(n^k)
多项式阶:随着数据规模的增长,算法的执行时间和空间占用按照多项式的比例增长。包括常量阶、对数阶、线性阶、线性对数阶、平方阶、立方阶等;
非多项式阶:随着数据规模的增长,算法的执行时间和空间占用暴增,这类算法性能极差。包括指数阶和阶乘阶。
对数阶举例
i = 1;
while (i <= n){
i = i*2;
}
五、空间复杂度分析
空间复杂度表示算法的存储空间与数据规模之间的增长关系,又称渐进空间复杂度。
void print(int n){
int i = 0;
int [] a = new int[n];
for (i; i<n; ++i){
a[i] = i * i;
}
for (i = n-1; i>=0; --i){
print out a[i]
}
}
第二行代码中,我们申请了一个空间存储变量i,但是它是常量阶的,跟数据规模n没有关系,所以可以忽略。第三行中,我们申请了一个大小为n的int类型数据。所以整段代码的空间复杂度就是O(n)。
熟能生巧