算法定义
算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。
好的算法,应该具有正确性、可读性、健壮性、高效率和低存储量的特征。
算法的优劣直接决定了程序运行的效率
算法特性
输入、输出
算法具有零个或多个输入
算法至少有一个或多个输出,算法是一定需要输出的
有穷性
算法执行有限步骤后,自动结束,不出现死循环,每一个步骤在可接受的时间内完成
确定性
每一步骤具有确定含义,无二义性
算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果。算法的每个步骤被精确定义而无歧义。
可行性
算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成(可转换为程序上机运行,并得到正确的结果)
算法设计要求
正确性
算法至少应该具有输入、输出和加工处理无歧义性、能正确反映问题的需求、能够得到问题的正确答案。
四个层次
1.算法程序没有语法错误。
2.算法程序对于合法的输入数据能够产生满足要求的输出结果。
3.算法程序对于非法的输入数据能够得出满足规格说明的结果。
4.算法程序对于精心选择的,甚至刁难的测试数据都有满足要求的输出结果。
一般情况下,层次3作为一个算法是否正确的便准
可读性
为了方便阅读、理解、交流
健壮性
当输入数据不合法时,算法也能做出相关处理,而不是产生异常或莫名其妙的结果。
时间效率高和存储量低
时间效率——算法的执行时间
存储量需求指的是算法在执行过程中需要的最大存储空间,主要指算法程序运行时所占用的内存或外部硬盘存储空间。
算法效率度量方法
1.事后统计方法:通过设计好的测试程序和数据,比较不同算法运行时间,确定算法效率高低。
有很大缺陷:必须事先编写好程序;依赖软硬件等环境因素;测试数据设计困难,并且程序运行时间与测试数据规模有很大关系。
(不科学、不准确)
2.事前分析估算方法:程序便之前,依据统计方法对算法进行估算。
影响高级程序语言编写程序在计算机上运行时间所消耗时间因素:
一、算法采用的策略和方法——算法好坏的根本
二、编译产生的代码质量——需软件支持
三、问题的输入规模
四、机器执行指令的速度——硬件性能
分析程序时,最重要的是把程序看成是独立于程序设计语言的算法或一系列步骤。
分析一个算法的运行时间时,重要是把基本操作的数量与输入规模关联,即基本操作的数量必须表示成输入规模的函数。
函数是渐进增长的
最高次项的指数大的,函数随着n的增长,结果也会变得增长特别快。
判断算法效率往往关注最高阶项
算法时间复杂度
一般情况下,随着n增大,增长最慢的算法为最优算法。
O(1)–常数阶、O(n)–线性阶、 O(n^2)–平方阶
O(1)–常数阶——单纯的分支结构(不包含在循环结构中)
O(n)–线性阶——循环结构
确定某个算法的阶次,需要确定某个特定语句或某个语句集运行的次数。
算法的复杂度关键是分析循环结构的运行情况
O(n^2)–平方阶——循环嵌套
循环的时间复杂度等于循环体的复杂度乘以循环运行次数
常见时间复杂度
最坏情况运行时间是一种保证,通常运行时间就是最坏情况的运行时间。
平均运行时间就是从概率角度,这个数字在每个位置的可能性是相同的,平均查找时间为n/2次后发现这个目标元素。(最有意义,期望的运行时间)一般通过运行一定数量的数据后估算出来
算法空间复杂度
写代码可以用空间换时间
时间复杂度——运行时间需求
空间复杂度——空间需求