线性表的定义
-
线性表(List):由零个或多个数据元素组成的有序结构。
-
若线性表记为(a1,……,ai-1,ai,ai+1,……an),则表中ai-1领先于ai领先于ai+1,称ai-1是ai的直接前驱元素,ai+1是ai的后继元素。
例子:
- 请问公司的组织架构是否属于线性关系?
- 分析:一般公司的总经理管理几个总监,每个总监管理几个经理,每个经理都有各自的下属和员工。
- 答:不是,因为线性关系的条件是如果存在多个元素,则第一个元素无前驱,而最后一个元素无后继,其他元素都有且只有一个前驱和后继。
抽象数据类型
数据类型
- 数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
- 例如很多编程语言的整型,浮点型,字符型这些指的就是数据类型。
- 原因:计算机的内存不是无限大的,不同的运算需要开辟不同的内存空间,于是计算机的研究者们就考虑,要对数据类型进行分类,分出多种数据结构类型来适合各种不同的计算条件差异。
- 例如在C语言中按照取值的不同,数据结构类型可以分为两类:
- 原子类型:不可以再分解的基本类型,例如整型、浮点型、字符型等。
- 结构类型:由若干个类型组合而成,是可以再分解的,例如整型数组是由若干整型数据组成的。
- 抽象:是指抽取出事物具有的普遍性的本质。它要求抽出问题的特征而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节。
- 抽象数据类型(Abstract Data Type , ADT) 是指一个数学模型及定义再该模型上的一组操作。
- 抽象数据类型的定义仅取决于它的一组逻辑特性,而与其再计算机内部如何表示和现实无关。
为了便于在之后的讲解中对抽象数据类型进行规范的描述,我们给出了描述抽象数据类型的标准格式(伪代码):
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作
endADT
线性表的抽象数据类型
- Operation
- InitList(*L):初始化操作,建立一个空的线性表L。
- ListEmpty(L):判断线性表是否为空表,若线性表为空,返回true,否则返回false。
- ClearList(*L):将线性表清空。
- GetElem(L,i,*e):将线性表L中的第i个位置元素值返回给e。
- LocationElem(L,e):在线性表中查找与给定值e相等的元素,如果查找成功,返回该元素在表中序号表示成功;否则,返回0表示失败。
- ListInsert(*L,i,e):在线性表L中第i个位置插入新元素e。
- ListDelete(*L, i *e):删除线性表L中第i个位置元素,并用e返回其值。
- ListLength(L):返回线性表L的元素个数。
- endADT
- 对于不同的应用,线性表的基本操作是不同的,上述操作是最基本的,对于实际问题中涉及的关于线性表的更复杂操作,安全可以用这些基本操作的组合实现。
线性表的顺序存储结构
线性表的两种物理存储结构:
顺序存储结构和链式存储结构。
- 线性表的顺序存储结构,指的是用一段地址连续的存储单元依次存储线性表的数据元素。
- 物理上的存储方式事实上就是在内存中找个初始地址,然后通过占位的形式,把一定的内存空间给占了,然后把相同数据类型的数据类型的数据元素一次放在这块空地中。
线性表顺序存储结构代码:
#define MAXSIZE 20
typedef int ElemType ;
typedef struct
{
ElemType data[MAXSIZE];
int langth; //线性表当前长度
}SqList;
总结下,顺序存储结构封装需要三个属性:
- 存储空间的起始位置,数组data,它的存储位置就是线性表存储空间的存储位置。
- 线性表的最大存储容量:数组的长度MAXSIZE。
- 线性表的当前长度:length。
- 注意,数组的长度于线性表的当前长度需要区分一下:数组的长度是存放线性表的存储空间的总长度,一般初始化后不变。而线性表的当前长度是线性表中的元素的个数,是会变化的。
地址计算方法
- 线性表的定义充分考虑到很多军师级别领导的智商指数,所以决定从1开始回归正常思维。
- 假设ELemType占用的时c个存储单元(字节),那么线性表中第i+1个数据和第i+1个数据元素和第i个数据元素的存储位置的关系是(LOC表示获得存储位置的函数):LOC(ai+1) = LOC(ai) + c。
- 所以对于第i个数据元素ai的存储位置可以有a1推算得出:LOC(ai) = LOC(a1) + (i-1)*c
- 通过这个公式,我们可以随时计算出线性表中任意位置的地址,不管它是第一个还是最后一个,都是相同的时间。那么它的存储时间性能当然就为O(1),我们通常称为随机存储结构。
获取元素操作
- 实现GetElem的具体操作,即将线性表L中的第i个位置元素值返回。就程序而言非常简单了,我们只需要把数组第i-1个下标的值返回即可。
#define OK 1
#define ERROR 0
#define TRUE 1
#define FALST 0
typedef int Status;
//Status 是函数的类型,其值是函数结果状态代码,如OK等。
//初始条件:顺序表L已存在,1<= i <= ListLength(L)
//操作结果:用e返回L中第i个数组元素的值。
Status GetElem(SqList L,int i, ElemType *e)
{
if(L.lngth == 0 || i< 1 || i>L.length)
{
return ERROR;
}
* e = L.data(i-1);
return OK;
}
插入操作
-
刚才我们也谈到,线性表的顺序存储结构具有随机存储结构的特点,时间复杂度为O(1)。
-
要实现的函数名:
-
ListInsert(*L , i , e),即在线性表L中的第i个位置插入新元素e
-
所以插入算法的思路:
- 如果插入位置不合理,抛出异常;
- 如果线性表长度大于等于数组长度,则抛出异常;
- 如果线性表的长度大于等于数组长度,则抛出异常或动态增加数组容量;
- 从最后一个元素开始向前遍历到第i个位置,分别将它们都向后移动一个位置;
- 将要插入元素填入位置i处;
- 线性表长+1;
-
代码实现:
Status ListInsert(SqList * L, int i , ElemType e) { int k; if(L->length == MAXSIZE){ //顺序表已经满了 return ERROR; } if(i < 1 || i > L.length +1 ){ //当i不在范围内时 return ERROR; } if(i <= L->length){ //若插入数据位置不在表尾 /*将要插入位置后数据元素向后移动一位*/ for( k = L->length-1; k>= i-1; k--){ L->data[k+1] = L->data[k]; } } L->data[i-1] = e; //将新元素插入 L->length++; return OK; //返回执行状态码 }
删除操作
-
删除算法的思路:
- 如果删除位置不合理,抛出异常;
- 取出删除元素;
- 从删除元素位置开始遍历到最后一个元素位置,分别将它们都向前移动一个位置;
- 表长-1。
-
代码实现:
/* 前提:顺序表L已经存在,且1<= i <= L->length-1; 执行结果: 经删除元素通过ElemType e接收,并返回执行状态码 */ Status ListDelete(SqList * L, int i , ElemType *e){ int k; if(L->length == 0){ //顺序表为空 return ERROR; } if( i < 1 || i > L->length){ //当i操作不当时 return ERROR; } e = L->data[i-1]; //把删除元素的数据赋值给e if(i < L->length){ //删除的数据元素的位置不在顺序表的末尾 for( k= i ; k < L->length ; k++){ L->data[k-1] = L->data[k]; } } L->length--; //顺序表表长减一 return OK; //返回状态码 }
分析
- 现在我们分析一下,插入和删除的时间复杂度。
- 最好的情况:插入和删除操作刚好要求在最后一个位置操作,因为不需要移动任何元素,所以此时的时间复杂度为O(1)。
- 最坏的情况:如果要插入和删除的位置时第一个元素,那就意味着要移动所有的元素向后或者向前,所以这个时间复杂度为O(n)。
- 至于平均情况,就取中间值O((n-1) /2)。
- 按照前边游戏秘籍指导,平均情况复杂度简化后还是O(n)。
线性表顺序存储结构的优缺点
- 线性表的顺序存储结构,在存、读数据时,不管时哪个位置,时间复杂度都是O(1)。而在插入或者删除时,时间复杂度都是O(n)。
- 这就说明,它比较适合元素个数比较稳定,不经常插入和删除元素,而更多的操作时存取数据的应用。
- 线性表顺序存储结构的优点:
- 无须为表示中间元素之间的逻辑关系而增加额外的存储空间。
- 可以快速地存取表中任意位置的元素。
- 线性表顺序存储结构的缺点
- 插入和删除操作需要移动大量元素。
- 当线性表长度变化时,难以确定存储空间的容量。
- 容易造成存储空间的“碎片”。