线性表及其结构
线性表(Linear list)
线性表是n个类型相同数据元素的有限序列,通常记作(a0、a1、…、ai-1、ai、ai+1…an-1)
1. 相同数据类型
在线性表的定义中,a0到an-1的n个数据元素是具有相同属性的元素。
可以是数字、字符,也可以是具有更复杂的数据元素,例如:学生、商品、装备。
相同数据类型意味着在内存中存储时,每个元素会占用相同的内存空间,便于后续的查询定位。
2. 序列(顺序性)
在线性表的相邻数据元素之间存在着序列关系,即ai-1是ai的直接前驱,ai是ai-1的直接后继,同时ai又是ai+1的直接前驱,ai+1是ai的直接后继,唯一没有直接前驱的元素a0一端为表头,唯一没有后继的元素an-1一端称为表尾。
除了表头和表尾外,任何一个元素都有且仅有一个直接前驱和直接后继。
3. 有限
线性表中数据元素的个数n定义为线性表的长度,n是一个有限值。
当n=0时线性表为空表。
在非空的线性表中每个元素在线性表中都有唯一确定的序号,例如a0的序号是0,ai的序号是i。
在一个具有n>0个数据元素的线性表中,数据元素序号(索引)的范围是[0,n-1]
线性表的逻辑结构:
线性表的存储结构:
- 顺序表----顺序存储结构
**特点:**在内存中分配连续的内存空间,只存储数据,不需要存储地址信息,位置就隐含着地址。
优点:
(1)节省存储空间,因为分配给数据的存储单元全用存放结点的数据(不考虑C/C++语言中数组需指定大小的情况),结点之间的逻辑关系没有占用额外的存储空间。
(2)索引查找效率高,即每一个结点对应一个序号,由该序号可以直接计算出结点的存储地址。
假设线性表的每个数据元素需占用K个存储单元,并以元素所占的第一个存储单元的地址作为数据元素的存储地址。
则线性表中序号为i的数据元素的存储地址LOC(ai)与序号为i+1的数据元素的存储地址LOC(ai+1)之间的关系为LOC(ai+1)=LOC(ai)+K;
通常来说,线性表的i号元素的存储地址为:LOC(ai)=LOC(a0)+i*K,其中LOC(a0)为0号元素a0的存储地址,通常称为线性表的其实地址。
缺点:
(1)插入和删除需要移动元素,效率较低。
(2)必须提前分配固定数量的空间,如果存储元素少,可能导致空闲浪费。
(3)按照内容查询效率低,因为需要逐个比较判断。
举例:长度为n的数组中删除元素,假设每个元素删除的概率是相同的,为时间复杂度是?
删掉第n个元素,需要移动0次
删掉第n-1个元素,需要移动1次
删掉第n-2个元素,需要移动2次
…
删掉第2个元素,需要移动n-2次
删掉第1个元素,需要移动n-1次
所以平均时间频度是:01/n+11/n+21/n+31/n+…+(n-1)*1/n=(n-1)/2
T(n)=(n-1)/2
T(n)=O(n)
数组中按照内容查询元素的时间复杂度是T(n)=O(n),时间频度为 ( 1 + 2 + 3 + . . . . . . + n ) ∗ ( 1 / n ) = ( 1 + n ) / 2 (1+2+3+......+n)*(1/n)=(1+n)/2 (1+2+3+......+n)∗(1/n)=(1+n)/2
- 链表----链式存储结构
**特点:**数据元素的存储对应的是不连续的存储空间,每个存储结点对应一个需要存储的数据元素。每个结点是由数据域和指针域组成,元素之间的逻辑关系通过存储节点之间的链接关系反应出来。逻辑上相邻的节点物理上不必相邻。
缺点:
(1)比顺序存储结构的存储密度小(每个节点都由数据与和指针域组成,所以相同空间内假设全存满的话顺序比链式存储更多)。
(2)查找结点时链式存储要比顺序存储慢(每个节点地址不连续、无规律,导致按照索引查询效率低下)。
优点:
(1)插入、删除灵活(不必移动节点,只要改变节点中的指针,但是需要先定位到元素上)。
(2)有元素才会分配结点空间,不会有闲置的结点。