第二章 算法
2.1 算法定义
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
2.2 算法的特性
<1>输入输出
算法具有零个或多个输入,至少有一个或多个输出。
<2>有穷性
指算法在执行有限的步骤之后,自动结束而不会出现无线循环,并且每一个步骤在可接受的时间内完成。
<3>确定性
算法的每一步骤都具有确定的含义,不会出现二义性。
<4>可行性
算法的每一步都是可行的,也就是说,每一步都能够通过执行有限次数完成。
2.3 算法设计的要求
<1>正确性
算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性、能正确反应问题的需求、能够得到问题的正确答案。
<2>可读性
算法设计的另一目的是为了便于阅读、理解和交流。
<3>健壮性
当输入数据不合法是,算法也能做出相关处理,而不是产生异常或莫名其妙的结果。
<4>时间效率高和储存量低
时间效率:算法的执行时间。
储存量需求指的是算法在执行过程中需要的最大储存空间,主要指算法程序运行时所占用的内存或外部硬盘的存储空间。
2.4 算法效率的度量方法
<1>事后统计方法
这种方法主要通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。
费时费力,不予考虑。
<2>事前分析估算方法
算法的时间取决于以下因素:
(1)算法采用的策略、方法。
(2)编译产生的代码质量。
(3)问题的输入规模。
(4)机器执行指令的速度。
2.5 函数的渐进增长
给定两个函数f(n)和g(n),如果存在一个整数N,使得对于所有的n > N,f(n)总是比g(n)大,那么,我们说f(n)的增长渐近快于g(n)。
随着n的增大,加减的常数对于算法的快慢影响不大,所以我们可以忽略这些常数。
从下表可以看出,最高次项的指数大的,函数随着n的增长,结果也会增长的很快。
综上,判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注主项(最高阶项)的阶数。
2.6 算法时间复杂度
在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为是啊金复杂度。其中f(n)是问题规模n的某个函数。
这样用大写O()来体现算法时间复杂度的记法,我们称为大O记法。
一般来说,随着n的增大,T(n)增长最慢的算法为最优算法。
2.6.1推导大O阶方法
方法:
1.用常数1取代运行时间中的所有加法常数。
2.在修改后的运行次数函数中,只保留最高阶项。
3.如果最高阶项存在且不是1,则去除与这个项相乘的常数。得到的结果就是大O阶。
2.6.2 常数阶
图1:
图2:
无论上图中的n等于多少,图1与2都只是执行3次与执行11次的区别。所以这种都记作O(1),而非o(3)或O(11)。
2.6.3 线性阶
分析算法的复杂度,关键就是分析循环结构的运行情况。
eg:
int i;
for(i=0;i<n;i++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
这段代码的时间复杂度为O(n),因为循环n次。
2.6.4 对数阶
2.9.5 平方阶
因为内循环n次,外循环n次,所以时间复杂度为O(n×n)
若一个循环n次,一个循环m次,则时间复杂度为O(n×m)
循环嵌套:
对于函数调用的例子:
如果函数function()是这样的
因为function()函数的时间复杂度是O(1),所以整个程序的时间复杂度是O(n)
如果函数function()是这样的:
那么这段程序的时间复杂度就是O(n×n) //因为函数中本身有n次循环
调用函数本身就要增加一次时间复杂度,调用n次就加n
2.7常见的时间复杂度
阶数是最重要的指标
2.8 最坏情况与平均情况
一般情况下,没有特殊强调的情况下,都是指最坏情况,但是一般程序运行的时候都是平均情况,即最坏情况的二分之一。
平均运行时间是所有情况下最有意义的,因为它是期望的运行时间。
2.9 算法空间复杂度
算法的空间复杂度通过计算方法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n)=O(f(n)),其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。
“时间复杂度”指运行时间的需求;“空间复杂度”指空间需求。