算法与算法效率的度量
什么是算法:
算法是为了解决某种特定的问题而规定的一个有限长的操作序列。如 大家预定候补车票使用队列这种数据逻辑结构:现在已经实现了操作①队头元素出队 ②新元素入队③交换队列i与j位置的元素。 那我们此时如何解决会员用户优先购买候补车票这个问题呢? 首先实现操作2其次寻找排在非会员用户前面一个会员用户的位置然后实现操作3,若该队列中无会员用户,则直接与对头元素交换。上述这一系列对改问题求解步骤的描述将是算法。
一个算法必须具备下列的5个重要特性:
有穷性 | 有穷的时间内执行完 |
确定性 | 相同的操作得到相同的结果,不会产生二义性 |
可行性 | 算法可以通过已经实现的基本操作来实现 |
输入 | 算法处理的数据:0或多个 |
输出 | 算法处理的结果:1个或多个,无输出的算法是没有任何意义的 |
上述的五个特性必须满足,如果不满足其中任何一个特性的话,那就不能称之为一个算法。程序 = 数据结构 + 算法 算法必须基于已有的数据结构,数据结构的学习中会有查找和排序这两类重要的算法。
算法效率的度量
衡量算法的效率一般有两类:事后统计法和事前分析估算法。事后统计法需先将算法实现,然后去测算其时间和空间的开销。这种方法缺陷很显然:算法的执行速度与运行的机器性能也是有很大关联的;与实现该算法所用的编程语言相关:越高级的语言执行效率越低;有的算法是不能进行事后统计的:如控制火箭飞行轨迹的算法。
事前分析估算法:时间开销T(n) 与问题规模n的关系
时间复杂度
评价一个算法的时间开销。
先看一段代码:
void fun(int n){
int i=1; //①
while(i<=n){ //②
printf("hello %d\n",i);//③
i++; // ④
}
语句频度:
① ----1次
② ----执行n+1次 与3,4,相比需要多执行最后一次i>n跳出循环
③,④ ----执行n次
时间开销与n的关系:T(n) = 2n+2
当 T(n)表达式比较复杂,就很难看出该算法的优劣
顺序执行的代码只会影响常数阶,可以忽略,在实际的应用中当问题规模n->∞时,算法的性能才能体现出来。则一个算法的时间开销表达式只要保留最高阶数就可以了。
T(n)与f(n)为同阶无穷小,算法执行时间的增长率与f(n)增长率大致相同,O(f(n)) 称为算法的渐近时间复杂度,简称时间复杂度
例1: T(n) = 3n³ +2n² + 9999 ,求时间复杂度
时间复杂度O(f(n))=O(n³)+O(n²)+O(1)=O(n³)
有:加法规则:多项相加,只保留最高阶的项,且系数变为1.
乘法规则:多项相乘,都保留
例2: T(n) = n³ + n²log(2)(n) ,求时间复杂度
O(f(n))=O(n³)+O(n² log(2)(n) ) =O(n³)
O(n³)阶数更高,保留
例3: 408统考:计算下列函数的时间复杂度:
void fun(int n){
int i=0, sum=0;
while(sum<n){
sum += i++;
}
return i;
}
sum += i++;
即:i++;sum+=i
设循环k次结束:sum=0+1+2+3+…+k=(1+k)*k/2
sum>=n
时间复杂度为√n
数量级由左向右递增:
时间复杂度数量级越小,算法越优秀。一般总是考虑算法在最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。
空间复杂度
算法的空间复杂度S(n) 为实现算法所需的空间量度:S(n) = O(g(n))。一般情况下,程序在执行时除了寄存本身所用的指令,常数,变量,输入数据外,还需要一些对数据进行操作的辅助存储空间。若算法执行时所需要的辅助空间相对于输入数据量而言是一个常数,则称这个算法为原地工作。(算法原地工作:指算法所需的辅助空间为常量,即O(1))。
例:
for(i=0;i<n;i++) //实现将1维数组a中n个元素逆置
b[i] = a[n-i-1];
for(i=0;i<n;i++)
a[i] = b[i];
借助了一个大小为n的辅助数组b,则空间复杂度为:O(n)
总结
对于一个算法,其时间复杂度和空间复杂度往往是相互影响的。但一般情况下,由于运算空间较充足,人们一般都已算法的时间复杂度作为算法优劣的衡量标准。