1. 基本概念和术语
程序设计 = 数据结构 + 算法
1.1 数据(描述客观事物的符号)
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据不仅仅包括整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
1.2 数据元素(建立数据模型的着眼点)
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。也被称为记录。
牛、马、羊、鸡、猪、狗等动物当然就是禽类的数据元素。
1.3 数据项(数据不可分割的最小单位)
数据项:一个数据元素可以由若干个数据项组成。
比如人有姓名、性别、年龄等元素。
数据项是数据不可分割的最小单位。
1.4 数据对象(性质相同的数据元素的集合)
数据对象:是性质相同的数据元素的集合,是数据的子集。在实际应用中,处理的数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
例如学生成绩表就是一个数据对象:
- 表的行被称为数据元素
- 表的列被称为数据项
1.5 数据结构
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
tips:
在计算机中,数据元素并不是孤立、杂乱无序的,而是具有内在联系的数据集合。数据元素之间存在的一种或多种特定关系,也就是数据的组织形式。
1.6 抽象数据类型
抽象是指抽取出事物具有的普遍性的本质。它是抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必需的信息。
我们对已有的数据类型进行抽象,就有了抽象数据类型。
抽象数据类型(Abstract Data Type,ADT):是指一个数学模型及定义在该模型上的一组操作。 抽象的意义在于数据类型的数学抽象特性。
抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。抽象数据类型把实际生活中的问题分解为多个规模小且容易处理的问题,然后建立一个计算机能处理的数据模型,并把每个功能模块的实现细节作为一个独立的单元,从而使具体实现过程隐藏起来。
描述抽象数据类型的标准格式:
比如线性表的抽象数据类型为:
2. 逻辑结构和物理结构(存储结构)
按照视点的不同,我们把数据结构分为逻辑结构和物理结构。
2.1 逻辑结构(数据元素之间的相互关系)
逻辑结构:是指数据对象中数据元素之间的相互关系。其实这也是我们今后最需要关注的问题。逻辑结构分为以下四种:集合结构、线性结构、树形结构、图形结构。
逻辑结构是针对具体问题的,是为了解决某个问题,在对问题理解的基础上,选择一个合适的数据结构表示数据元素之间的逻辑关系。
我们在用示意图表示数据的逻辑结构时,要注意两点:
- 将每一个数据元素看做一个结点,用圆圈表示。
- 元素之间的逻辑关系用结点之间的连线表示,如果这个关系是有方向的,那么用带箭头的连线表示。
2.1.1 集合结构(只有在一个集合内的关系)
集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。
2.1.2 线性结构(一对一的关系)
线性结构:线性结构中的数据元素之间是一对一的关系
2.1.3 树形结构(一对多的关系)
树形结构:树形结构中的数据元素之间存在一种一对多的层次关系
2.1.4 图形结构(多对多的关系)
图形结构:图形结构的数据元素是多对多的关系
2.2 物理结构(存储结构)
物理结构:是指数据的逻辑结构在计算机中的存储形式。
数据的存储结构应正确反映数据元素之间的逻辑关系
2.2.1 顺序存储结构(常用)
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的
2.2.2 链式存储结构(常用)
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
链式存储相比于顺序存储更加灵活,数据存在哪里不重要,只要有一个指针存放了相应的地址就能找到它了。
2.2.3 索引存储结构(补充)
2.2.4 哈希存储结构(补充)
散列存储(也称哈希存储)方式是指将数据元素存储在一片连续的区域内,每一个数据元素的具体存储地址是根据该数据元素的关键字值,通过散列(哈希)函数直接计算出来的。这种方式所表示的存储结构称为散列(哈希)存储结构。
2.2.5 小结
3. 存取结构(读写方式)
- 随机存取就是直接存取,可以通过下标直接访问的那种数据结构,与存储位置无关,例如数组。(在知道第一个单元的位置时,通过简单运算,根据它相邻的特性也就知道其后所有元素的数据位置。数组底层保存的是数组第一个位置的指针,你想根据下标访问某个位置或者存某个位置,可以直接由首指针+下标×偏移位置的和得到目的地址)。
- 顺序存取(非随机存取)不能通过下标访问,只能按照存储顺序存取,也就是存取第N个数据时,必须先访问前(N-1)个数据。与存储位置有关,例如链表Q。