算法效率
算法效率分析分为两种:
- 时间效率
时间效率被称为时间复杂度,主要衡量的是一个算法的运行速度。 - 空间效率
空间效率被称为空间复杂度,主要衡量一个算法所需要的额外空间。
在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度
一个算法执行所耗费的时间,从理论上说,是不能算出来的,我们只有把程序放在机器上运行起来,才能知道。但是我们把每个算法都上机测试很麻烦,所以才有了时间复杂度这个分析方式。
【一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度】。
大O渐进表示法
请看如下代码:
void Func1(int N){
int count = 0;
for (int i = 0; i < N ; ++ i){
for (int j = 0; j < N ; ++ j){
++count;
}
}
for (int k = 0; k < 2 * N ; ++ k){
++count;
}
int M = 10;
while (M--){
++count;
}
printf("%d\n", count);
}
上面Func1
函数执行的基本操作次数为:
F(N) = N^2^ + 2*N + 10
如果N = 10,F(N) = 130
如果N = 100,F(N) = 10210
如果N = 1000,F(N) = 1002010
实际中我们计算时间复杂度时,其实不一定要精确到具体的执行次数,而只需要大概的执行次数,此时就使用大O的渐进表示法。
大O如何计算推导?
- 用常数1取代运行时间中的所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数,得到的结果就是大O阶
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。当N
无限大时,除过最高阶项外其他项以及常数都趋近于0
,可以省略,代码的时间效率只与参数N
有关。
那么Func1
函数的时间复杂度就是O(N)
。
- 小结:
决定程序时间复杂度的是最高阶项。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
时间复杂度一般考虑最坏情况
例如:在一个长度为N
数组中搜索一个数据x
:
最好情况:1
次找到
最坏情况:N
次找到
平均情况:N/2
次找到
常见时间复杂度典例
例题一:
void Func2(int N){
int count = 0;
for (int k = 0; k < 2 * N ; ++k){
++count;
}
int M = 10;
while (M--){
++count;
}
printf("%d\n", count);
}
- 代码中基本操作执行了
2N+10
次,通过推导大O阶方法忽略掉常数项,时间复杂度为O(N)
。
例题二:
void Func3(int N, int M){
int count = 0;
for (int k = 0; k < M; ++k){
++count;
}
for (int k = 0; k < N ; ++k){
++count;
}
printf("%d\n", count);
}
- 代码中基本操作执行了
M+N
次,时间复杂度为O(N+M)
。
例题三:
void Func4(int N){
int count = 0;
for (int k = 0; k < 100; ++k){
++count;
}
printf("%d\n", count);
}
- 代码中基本操作执行了
100
次,时间复杂度为O(1)
。
例题四:
const char * strchr ( const char * str, int character );
- 代码中基本操作执行最好
1
次,最坏N
次,时间复杂度一般看最坏,时间复杂度为O(N)
。
例题五:
// 计算冒泡排序的时间复杂度
void BubbleSort(int* a, int n){
assert(a);
for (size_t end = n; end > 0; --end){
int exchange = 0;
for (size_t i = 1; i < end; ++i){
if (a[i-1] > a[i]){
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
- 代码中基本操作执行最好
N
次,最坏执行了(N*(N+1)/2
次,通过推导大O阶方法 + 时间复杂度一般看最坏前提,时间复杂度为O(N^2)
。
例题六:
// 计算折半查找的时间复杂度
int BinarySearch(int* a, int n, int x){
assert(a);
int begin = 0;
int end = n-1;
while (begin < end){
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid;
else
return mid;
}
return -1;
}
- 代码中基本操作执行最好
1
次,最坏logN
次,时间复杂度为O(logN)
【注】:logN
在算法分析中默认表示是底数为2
,对数为N
。有些地方会写成lgN
。
例题七:
// 计算阶乘递归Factorial的时间复杂度
long long Factorial(size_t N){
return N < 2 ? N : Factorial(N-1)*N;
}
- 代码中通过计算分析发现基本操作递归了
N
次,时间复杂度为O(N)
。
例题八:
// 计算斐波那契递归Fibonacci的时间复杂度
long long Fibonacci(size_t N){
return N < 2 ? N : Fibonacci(N-1)+Fibonacci(N-2);
}
- 代码中基本操作递归了
2^N
次,时间复杂度为O(2^N)
。(建议读者画图递归栈帧的二叉树理解)
空间复杂度
空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少bytes
的空间,因为这个也没太大意义,所以空间复杂度算的是开辟变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
例如:
- 例题五中的冒泡排序:使用了
常数
个额外空间,所以空间复杂度为O(1)
。 - 例题七中阶乘递归
Factorial
:递归调用了N
次,开辟了N
个栈帧,每个栈帧使用了常数
个空间。空间复杂度为O(N)
。 - 计算
Fibonacci
的空间复杂度:
long long* Fibonacci(size_t n){
if(n==0)
return NULL;
long long * fibArray = new long long[ n+1];
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n ; ++i){
fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
}
return fibArray ;
}
以上程序动态开辟了N
个空间,空间复杂度为O(N)
。