术语
程序设计=数据结构+算法
数据结构:相互之间存在一种或多种特定关系的数据元素的集合
数据:输入到计算机中可以操作的对象,数值类型(整型,浮点型),非数值类型(字符,音乐、图像、视频)
数据元素(记录):组成数据,在计算机中作为整体,有意义的基本单位,eg,一个人
数据项:数据的最小单位,若干个一起组成数据元素,eg,人的年龄,性别
数据对象:性质相同的数据元素的集合,eg:很多人
逻辑结构:数据元素之间的相互关系
- 集合结构:同属于一个集合
- 线性结构:一对一
- 树形结构:一对多
- 图形结构:多对多
物理结构:在计算机的存储形式
- 顺序存储:存放在地址连续的存储单元
- 链式存储:存放在任意的存储单元,连续或不连续,通过指针寻访数据元素地址
数据类型:
- 原子类型:基本类型,整型,字符型,浮点型
- 结构类型:基本类型组合而成,可分解,数组,结构体,枚举,联合体
抽象数据类型ADT:数学模型,数据对象+数据元素之间的关系+对数据元素的操作
算法
解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
算法特性:
- 输入输出
- 有穷性:执行有限的步骤之后自动结束,不会无限循环,执行时间可接受
- 确定性:每一步有确定的含义,不会出现二义性
- 可行性:每一步都能通过执行有限次数完成
算法要求:
- 正确性:针对各种(对的、错的、奇怪的)输入,可以做出正确的加工处理,返回正确的输出和提示,没有语法错误
- 可读性
- 健壮性:输入数据不合法时做处理
- 时间效率高,存储量低:最小的空间,最快的时间
效率统计:
- 事后统计:计算机计时
- 事前分析:算法好坏+输入规模,除去计算机软件硬件因素
函数的渐近增长:
给定两个函数f(n)和g(n),存在一个整数N,使得对于所有的n>N时,f(n)>g(n),f(n)的增长渐近快于g(n)
判断算法效率时,函数中的常数和次要项可以忽略,关注主项(最高阶项的阶数)
时间复杂度
语句总的执行次数T(n)是关于问题规模n的函数
分析T(n)随n的变化情况并确定T(n)的数量级
算法的渐近时间复杂度:T(n)=O(f(n)) 表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,f(n)是问题规模n的运行次数函数
随着n的增大,T(n)增长最慢的算法为最优算法
O() :大O记法
推导方法:
f(n)=n2/2+n/2+12
- 常数1取代运行运行时间中所有的加法常数
n2/2+n/2+1 - 只保留最高阶项
n2/2 - 最高阶项存在且不是1,去除与这个项相乘的常数
n2
O(1)常数阶
与问题规模无关,执行时间恒定的算法
eg:f(n)=3; O(f(n))=1;
O(n)线性阶
循环体内的代码要执行n次
eg:f(n)=3n+2; O(f(n))=n;
O(logn)对数阶
2x=n
x=log2n
int count = 1;
while (count < n)
{
count = count * 2;//执行x次
}
O(nlogn)阶
eg:f(n)=3n+2nlog2n+19; O(f(n))=nlogn;
O(n2)平方阶
循环嵌套
f(n)=n2/2+n/2+12;T(n)=O(f(n))=n2
O(n3)立方阶
f(n)=6n3/2+2n2+3n+12;T(n)=O(f(n))=n3
O(2n)指数阶
时间复杂度排序
O(1)<O(logn)<O(n)<O(nlogn)<O(n2)<O(n3)<O(2n)<O(n!)<O(nn)
最坏情况
一般没有特殊情况,运行时间按照最坏情况算
平均情况
所有情况中最有意义的,期望运行时间
空间复杂度
计算算法所需存储空间实现
S(n)=O(f(n)),n为问题规模,f(n)为n占存储空间的函数
空间复杂度O(1):算法对输入数据原地操作,所需的辅助空间对输入数据来说只是常数