参考资料:《大话数据结构》,作者程杰,清华大学出版社
什么是数据结构
数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。这里不得不提一个著名的公式:程序设计=数据结构+算法。
在说数据结构之前,我们应该先要了解什么是数据。数据是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据包括整型、实型等数值类型,也包括字符、声音、图像、视频等非数值类型。也就是说,这里所说的数据其实就是符号,他们具备两个前提:可以输入到计算机中,能被计算机程序处理。
数据元素是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。一个数据元素可以由若干个数据项组成。举个简单的例子,在人类中,人就是数据元素,而人的眼睛、耳朵、鼻子、手、脚等就是数据项,人的姓名、性别、年龄、联系方式等也可以是数据项。具体有哪些数据项,要视系统而决定。数据项是数据不可分割的最小单位。
数据对象是性质相同的数据元素的集合,是数据的子集。
以上说的这么多都属于数据的范畴,接下来我们来说一下什么是结构。
简单来说,结构就是关系。而严格来说,结构是指各个组成部分相互搭配和排列的方式。不同数据元素之间不是独立的,而是存在特定的关系。
说了这么多,数据结构就是相互之间存在一种或多种特定关系的数据元素的集合。在计算机中,数据元素并不是孤立、杂乱无序的,而是具有内在联系的数据集合。数据元素之间存在的一种或多种特定关系,也就是数据的组织形式。
逻辑结构和物理结构
数据结构分为逻辑结构和物理结构。
逻辑结构是指数据对象中数据元素之间的相互关系,分为以下四种:
1.集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其它关系。它类似于数学中的集合。如下图所示。
2.线性结构:线性结构中的数据元素之间是一对一的关系。如下图所示。
3.树形结构:树型结构中的数据元素之间存在一种一对多的层次关系。如下图所示。
4.图形结构:图形结构的数据元素是多对多的关系。如下图所示。
说完了逻辑结构,我们再来说一说物理结构(也叫存储结构)。物理结构是指数据的逻辑结构在计算机中的存储形式。它分为以下两种结构:
1.顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。数组就是这样的顺序存储结构。顺序存储结构如下图所示。
2.链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。数据元素的存储关系并不能反映其逻辑关系,因此需要用一个指针存放数据元素的地址,通过地址就可以找到相关联数据元素的位置。链式存储结构如下图所示。
抽象数据类型
数据类型是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。数据类型按照值的不同进行划分。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型用来说明变量或表达式的取值范围和所能进行的操作。
在C语言中,按照取值的不同,数据类型可以分为两类。一类是原子类型,它是不可以再分解的基本类型,包括整型、实型、字符型等。另一类是结构类型,它由若干个类型组合而成,是可以再分解的,比如整型数组就是由若干个整型数据组成的。
抽象数据类型(Abstract Data Type, ADT)是指一个数学模型及定义在该模型上的一组操作。抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。“抽象”的意义在于数据类型的数学抽象特性。事实上,抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。
下面给出了描述抽象数据类型的标准格式。
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作1
初始条件
操作结果描述
操作2
……
操作n
……
endADT