绪论
一.数据结构在程序设计中的作用
数据结构问题起源于程序设计
数据处理:处理数据,设计方案(算法)
二.本书讨论的主要内容
问题→抽象出问题的模型→求模型的解
数 值 问 题→数学方程
非数值问题→数据结构
本书讨论非数值问题的数据组织和处理,主要内容如下:
(1)数据的逻辑结构:线性表、树、图等数据结构,其核心是如何组织待处理的数据以及数据之间的关系;
(2)数据的存储结构:如何将线性表、树、图等数据结构存储到计算机的存储器中,其核心是如何有效地存储数据以及数据之间的逻辑关系;
(3)算法:如何基于数据的某种存储结构实现插入、删除、查找等基本操作,其核心是如何有效地处理数据;
(4)常用数据处理技术:查找技术、排序技术、索引技术等
三.数据结构的基本概念
数值数据:整数、实数等
非数值数据:图形、图象、声音、文字等
数据项:构成数据元素的不可分割的最小单位
数据结构:相互之间存在一定关系的数据元素的集合。按照视点的不同,数据结构分为逻辑结构和存储结构。
数据的逻辑结构是从具体问题抽象出来的数据模型
数据结构从逻辑上分为四类:
⑴ 集合:数据元素之间就是
“属于同一个集合” ;
⑵ 线性结构:数据元素之间
存在着一对一的线性关系;
⑶ 树结构:数据元素之间存在
着一对多的层次关系;
⑷ 图结构:数据元素之间存在
着多对多的任意关系。
两种存储结构:
1. 顺序存储结构:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。
2. 链接存储结构:用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示 。
逻辑结构和存储结构之间的关系
抽象数据类型
. 数据类型(Data Type):一组值的集合以及定义于这个值集上的一组操作的总称。
例如:C++中的整型变量
2. 抽象(Abstract):抽出问题本质的特征而忽略非本质的细节。
例如: 地图、驾驶汽车
3. 抽象数据类型(Abstract Data Type,ADT):一个数据结构以及定义在该结构上的一组操作的总称。
四.算法及算法分析
算法:是对特定问题求解步骤的一种描述,是指令的有限序列。
算法的五大特性:
⑴输入:一个算法有零个或多个输入。
⑵ 输出:一个算法有一个或多个输出。
⑶ 有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。
⑷ 确定性:算法中的每一条指令必须有确切的含义,对于相同的输入只能得到相同的输出。
⑸ 可行性:算法描述的操作可以通过已经实现的基本操作执行有限次来实现。
算法的描述方法
自然语言
优点:容易理解
缺点:冗长、二义性
使用方法:粗线条描述算法思想
注意事项:避免写成自然段
流程图
优点:流程直观
缺点:缺少严密性、灵活性
使用方法:描述简单算法
注意事项:注意抽象层次
程序设计语言
优点:能由计算机执行
缺点:抽象性差,对语言要求高
使用方法:算法需要验证
注意事项:将算法写成子函数
伪代码
伪代码:介于自然语言和程序设计语言之间的方法,它采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。
优点:表达能力强,抽象性强,容易理解
算法分析--度量算法效率的方法:
缺点:⑴ 编写程序实现算法将花费较多的时间和精力;
⑵ 所得实验结果依赖于计算机的软硬件等环境因素。
算法分析:对算法所需要的计算机资源——时间和空间进行估算。
时间复杂性 空间复杂性
问题规模:输入量的多少。
基本语句:是执行次数与整个算法的执行次数成正比的操作指令。
定理:若A(n)=amnm+am-1nm-1+¼+a1n+a0是一个m次多项式,则A(n)=O(nm)。
说明:在计算算法时间复杂度时,可以忽略所有低次幂和最高次幂的系数。
Ο(1)<(log2n)<(n)<(nlog2n)<(n2)<(n3)<…<(2n)<(n!)
结论:如果问题规模相同,时间代价与输入数据有关,则需要分析最好情况、最坏情况、平均情况。