基本概念及术语
说到数据结构是什么,我们得先来谈谈什么叫数据。
数据
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据不仅仅包括整型、实型(浮点数)等数值类型,还包括字符及声音、图像、视频等非数值类型。
我们的这里说的数据,其实就是符号,而且这些符号必须具备两个前提:
- 可以输入到计算机中。
- 能被计算机程序处理。
对于字符数据类型,就需要进行非数值的处理。而声音、图像、视频等其实是可以通过编码的手段编程字符数据来处理的。
数据元素
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。
比如人类中,人是数据元素。
畜禽类,牛、马、羊、猪、鸡、鸭是畜禽类的数据元素。
数据项
数据项:一个数据元素可以由若干个数据项组成。
比如人这样的数据元素,可以有眼睛、耳朵、鼻子、嘴巴、手这些数据项,具体有哪些数据项,要由你做的系统来决定。
数据项是数据不可分割的最小单位。在“数据结构”这门课程中,我们把数据项定义为最小单位,是有助于我们更好地解决问题的。但在真正讨论问题时,数据元素才是数据结构中建立数据模型的着眼点。就像我们讨论一部电影时,是讨论这部电影角色这样的“数据元素”,而不是针对这个角色的姓名或者年龄这样的“数据项”去研究分析。
数据对象
数据对象:是性质相同的数据元素的集合,是数据的子集。
什么叫性质相同呢,是指数据元素具有相同数量和类型的数据项,比如,还是刚才的例子,人都有姓名、生日、性别等相同的数据项。
既然数据对象是数据的子集,在实际应用中,处理的数据元素通常具有相同性质,在不产生混淆的情况下,我们都将数据对象简称为数据。
数据结构
结构,简单的理解就是关系,比如分子结构,就是说组成分子的原子之间的排列方式。
严格点说,结构是指各个组成部分相互搭配和排列的方式。在现实世界中,不同数据元素之间不是独立的,而是存在特定的关系,我们将这些关系称为结构。
在计算机中,数据元素并不是孤立、杂乱无序的,而是具有内在联系的数据集合。数据元素之间存在的一种或多种特定关系,也就是数据的组织形式。
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
逻辑结构和物理结构
按照视点的不同,我们把数据结构分为逻辑结构和物理结构。
逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。
1、集合结构
集合结构:集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系。
各个数据元素是“平等”的,它们共同属性是“同属于一个集合”。数据结构中的集合关系就类似于数学中的集合。
2、线性结构
线性结构:线性结构中的数据元素之间是一对一的关系。
如: 1-2-3-4-5-6-7-8-9
3、树形结构
树形结构:树形结构汇总的数据元素之间存在一种一对多的层次关系。
4、图形结构
图形结构:图形结构的数据元素是多对多的关系。
物理结构
也叫存储结构。
物理结构:是指数据的逻辑结构在计算机中的存储形式。
- 顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
说白了,就是排队站位。
- 链式存储结构
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
逻辑结构是面向问题的,而物理结构是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
数据类型
数据类型定义
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
在c语言中,按照取值的不同,数据类型可以分为两类:
-
原子类型
是不可以再分解的基本类型,包括整型、实型(浮点型)、字符型等 -
结构类型
由若干个类型组合而成,是可以再分解的。例如,整型数组是由若干整型数据组成的。
抽象是指抽取出事物具有的普遍性的本质。
抽象数据类型
抽象数据类型(ADT):一个数学模型及定义在该模型上的一组操作。
抽象数据类型不仅仅指哪些已经定义并实现的数据类型,还可以是计算机编程者在设计软件程序时自己定义的数据类型,比如我们编写关于计算机绘图或者地图类的软件系统,经常都会用到坐标。也就是说,总是有成对出现的x和y,在3D系统中还有z出现,既然这三个整型数字是始终在一起出现,我们就定义一个叫point的抽象数据类型,它有x、y、z三个整型变量,这样我们很方便地操作一个point数据变量就能知道这一点的坐标了。
抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。