第1章 绪论
用计算机求解任何问题都离不开程序设计,程序设计的实质是数据表示和数据处理。数据要能被计算机处理,首先必须能够存储在计算机的内存中,这项任务称为数据表示,其核心是数据结构:一个实际问题的求解必须满足各项处理要求,这项任务称为数据处理,其核心是算法。
1.1 数据结构在程序设计中的作用 数据结构+算法=程序
由问题到想法需要分析问题,抽象出具体的数据模型,形成问题求解的基本思路:由想法到算法需要完成数据表示和数据处理;由算法到程序需要将算法的操作步骤转换为某种程序设计语音对应的语句,换言之,就是用某种程序语言描述数据处理的过程。
1.2 本书讨论的主要内容
计算机能够求解的问题一般分为数值问题和非数值问题。数值问题抽象出的数据模型通常是数学方程;非数值问题抽象出的数据模型通常是线性表、树、图等数据结构。
本书讨论非数值问题的数据组织和处理,主要内容有如下4点
(1) 数据的逻辑结构
(2) 数据的存储结构
(3) 算法
(4) 常用数据处理技术
1.3 数据结构的基本概念
1.3.1 数据结构
数据时信息的载体,在计算机科学中是指所有能输入到计算机中并能被计算机识别和处理的符号集合。可以将数据分为两大类:一类是整数、实数等数值数据;另一类是文字、声音、图形、图像等非数值数据。
数据元素是数据的基本单位,在就算几程序中通常作为一个整体进行考虑和处理。构成数据元素的不可分割的最小单位称为数据项。
数据结构是指互相之间存在一定关系的数据元素的集合。按照视点的不同,数据结构分为逻辑结构和存储结构。
数据的逻辑结构是指数据元素之间逻辑关系的整体。
根据数据元素之间逻辑关系的不同,数据结构分为以下四类。
(1) 集合:数据元素之间就是“属于同一个集合”,除此之外,没有任何关系。
(2) 线性结构:数据元素之间存在着一对一的线性关系。
(3) 树结构:数据元素之间存在着
(4) 图结构:数据元素之间存在着多对多的任意关系。
数据的存储结构又称为物理结构,是数据及其逻辑结构在计算机中的表示,换言之,存储结构除了存储元素之外,必须隐式或显式地存储数据元素之间的逻辑关系。通常有两种存储结构:顺序存储结构和链接存储结构。
顺序存储结构的基本思想是:用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。
连接存储结构的基本思想是:用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示。
1.3.2
抽象数据类型
数据类型:是一组值的集合以及定义于这个值集上的一组操作的总称。规定了该类型数据的取值范围和对这些数据所能采取的操作。
抽象数据类型(ADT):是一个数据结构以及定义在该结构上的一组操作的总称。
类型数据类型和ADT的区别
数据类型指的是高级程序设计语言支持的基本数由类的成员变量来实现。
ADT指的是自定义的数据类型。ADT的每个操作由类的成员函数来实现。
1.4 算法及其描述方法
(1) 什么是算法
算法必须满足下列5个重要特性。
{1}输入:一个算法有零个或多个输入,这些输入通常取自于某个特定的对象集合。
{2}输出:一个算法有一个或多个输出,通常输出与输入之间有某种特定的关系。
{3}有穷性:一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。
{4}确定性:算法中每一条指令必须有确切的涵义,不纯在二义性,并且,在任何条件下,对于相同的输入只能得到相同的输出。
{5}可行性:算法描述的操纵可以通过已经实现的基本操作执行有限次来实现。
(2)算法的描述方法
1.自然语言
最大的优点容易理解,缺点是容易出现二义性,并且算法通常都很冗长。
2.流程图
优点是直观易懂,缺点是严密性不如程序设计语言,灵活性不如自然语言。
3.程序设计语言
用程序设计语言描述的算法能有计算机直接执行,却缺点是抽象性差,是算法设计者拘泥于描述算法的具体细节,忽略了“好”算法和正确逻辑的重要性,此外,还要求算法设计者长我程序设计语言及其编程技巧。
4.伪代码
伪代码是介于自然和程序设计语言和程序设计语言之间的方法,她采用某一程序设计语言的基本语法,操作指令可以结合自然语言来设计。至于算法中自然语言的成分有多少,却绝育算法的抽象级别。抽象级别高的伪代码自然语言多一些,抽象级别低的伪代码程序设计语言的语句多一些。
1.4.2 算法分析
1、度量算法效率的方法
事后统计 缺点:(1)编写程序实现算法将花费较多的时间
(2)所得实验结果依赖于计算机的软硬件等环境因素,有时容易掩盖算法本身的优势
事前分析估算——渐进复杂度
2.算法的时间复杂度:只考察当问题规模充分大时,算法中基本语句的执行次数在渐进意义下的阶,称为算法的渐进时间复杂度,通常用O记号表示。
常见的时间复杂度如下
O(log2n)<O(n)<O(n*log2n)<O(n2)<O(n3)<…<O(2n)<O(n!)