1.1 数据结构讨论的范畴
数据结构+算法=程序设计。
例如:数值计算的程序设计问题
结构静力分析计算
——线性代数方程组
非数值计算发的程序设计问题
例1:求一组整数中的最大值?
例2:计算机对弈(算法与模型)
例3:足协的数据库管理
算法:需要管理的项目?如何管理?用户界面?
概况地说,数据结构描述现实世界实体的数学模型(非数值计算)的程序设计问题及其在计算机上的操作与实现。
1.2基本概念
一、数据与数据结构
数据:所有能被输入到计算机中,且被计算机处理的符号的集合计算机操作的对象的总称,是计算机处理的信息的某种特定的符号表示形式。
数据元素:数据中的一个“个体”,数据结构中讨论的基本单位。。
数据项:数据结构中讨论的最小单位,数据元素是数据项的集合。
例如:运动员(数据元素)
数据结构:带结构的数据元素的集合。
例如:一个含12位数的的十进制数可以用三个4位的十进制数表示。存在“次序”关系。
又如,2行3列的二维数组
数据的逻辑结构可归结为以下四类:
线性结构
树形结构
图状结构
集合结构
数据结构的形式定义为:数据结构是一个二元组。强调数据之间的逻辑关系。
数据的存储结构:逻辑结构在存储器中的映像
数据元素的映像方法:用二进制位的位串表示数据元素
关系的映像方法:(表示《x,y》的方法)
顺序映像:以存储位置的相邻表示后继关系(y的储存位置和x的储存位置之间差一个常量C)而C是一个隐含值,整个储存结构中只含数据元素本身的信息。
链式映像:以附加信息(指针)表示后继关系(需要用一个和x在一起的附加信息指示y的存储位置)
在不同的编程环境中,储存结构可有不同的描述方法。
二、数据类型
在用高级程序语言编写的程序中,必须对程序出现的每个变量、常量或表达式,明确说明它们所属的数据类型。
数据类型是一个值的集合和定义在此集合上的操作的总称。
三、抽象数据类型
是指一个数学模型以及定义在此数学模型上的一组操作。
两个重要特征:数据抽象/用ADT描述程序处理的实体时,强调的是其本质的特征。
数据封装
描述方法:抽象数据类型可用(D,S,P)三元组来表示
其中,D是数据对象,S是D上的关系集,P是对D的基本操作集。
需要通过固有数据类型来实现。
1.3算法和算法的衡量
一、算法
算法是为了解决某类问题而规定的一个有限长的操作序列。必须满足以下五个重要特性:
1.有穷性——对于任何一组合法输入值,在执行有穷步驟之后一定能结束,即:算法中的每个步驟在有限时间内能结束;
2.确定性——对于每种情况下所应执行的操作,在算法中都有确切的规定,使算法的执行者或阅读者都能明确地理解;
3.可行性——算法中的所有操作都必须足够基本,都可以通过已实现的基本操作运算有限次实现之;
4.输入——作为算法加工对象的量值,通常体现为算法中的一组变量。有些输入需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法中;
5.输出——它是一组与“输入”与确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。
二、算法设计的原则
1.正确性
首先,算法应当满足以特定的“规格说明”方式给出的需求。
其次,对算法是否“正确”的理解可以有以下四个层次:
a.程序中不含语法错误;
b.程序对于几组输入数据能够得出满足要求的结果;
c.对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足要求的结果;
d.程序对于一切合法的输入数据都能得出满足要求的结果;
2.可读性
算法主要是为了人的阅读与交流,其次才是机器执行。可读性好有助于人对算法的理解;晦涩难读的程序易于隐藏较多错误,难以调试和修改。
3.健壮性
当输入的数据非法时,算法应当恰当地作出放映或进行相应处理,而不是产生莫名其妙的输出结果。
4.高效率与低存储量需求
通常,效率指的是算法执行时间;存储量指算法执行过程中所需要的最大存储空间。
三、算法效率的衡量方法和准则
1.事后统计法
缺点:1.必须执行程序;2.其他因素掩盖算法本质
2.事前分析估算法
和算法执行时间相关的因素:
1.算法选用的策略
2.问题的规模
3.编写程序的语音
4.编译程序产生的机器代码的质量
5.计算机执行指令的速度
假如,随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,则可记作:T(n)=O(f(n)),称为T(n)为算法的渐近时间复杂度。
如何估算?
算法 = 控制结构 + 原操作(固有数据类型的操作)
算法的执行时间=原操作(i)的执行次数之和*原操作(i)的执行时间
从算法中选取一种对于所研究的问题来说是基本操作的原操作,以该基本操作在算法中重复执行的次数作为算法运行时间的衡量准则。
语句的频度指的是该语句重复执行的次数。
四、算法的存储空间需求
S(n)=O(g(n))
包括:1.输入数据;2.程序本身(可不考虑);3.辅助变量。
学习要点:
1.熟悉各名词、术语的含义,掌握基本概念。
2.理解算法五个要素的确切含义。
3.掌握计算语句频度和估算算法时间复杂度的方法。