1 抽象数据类型
- 理解抽象数据类型
- 我们对已有的数据类型进行抽象,就有了抽象数据类型。
- 抽象数据类型(Abstract Data Type,ADT)是指一个数学模型及定义在该模型上的一组操作。
- 抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。
- 比如1+1=2这样一个操作,在不同CPU的处理上可能不一样,但由于其定义的数学特性相同,所以在计算机编程者看来,它们都是相同的。“抽象”的意义在于数据类型的数学抽象特性。
- 为了便于在之后的讲解中对抽象数据类型进行规范的描述,我们给出了描述抽象数据类型的标准格式:
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作
endADT
2 线性表
2.1 定义(略看)
线性表(List):由零个或多个数据元素组成的有限序列。
首先它是一个序列,也就是说元素之间是有个先来后到的(有顺序),像刚才的小蝌蚪就没有顺序。
若元素存在多个,则第一个元素无前驱,而最后一个元素无后继,其他元素都有且只有一个前驱和后继。
另外,线性表强调是有限的,事实上无论计算机发展到多强大,它所处理的元素都是有限的。
若将线性表记为(a1,…,ai-1,ai,ai+1,…an),则表中ai-1领先于ai,ai领先于ai+1,称ai-1是ai的直接前驱元素,ai+1是ai的直接后继元素。
线性表元素的个数n(n>=0)定义为线性表的长度,当n=0时,称为空表,记为()。
在不同的问题中,数据元素代表的具体含义不同:
- 线性表L1: (12, 58, 45, 2, 45, 46), 其元素为数字;
- 线性表L2: (a, g, r, d, s, t), 其元素为字母。
表格术语:
- 每个学生的学号﹑姓名﹑性别﹑成绩构成一个数据元素。
- 这种由若干数据项构成的数据元素常称为记录,含有大量记录的线性表称为文件。
2.2 线性表的抽象数据类型定义
- ADT 线性表(List)
Data
- 线性表的数据对象集合为{a1,a2,…,an},每个元素的类型均为DataType(//整型、浮点…)。其中,除第一个元素a1外,每 一个元素有且只有一个直接前驱元素,除了最后一个元素an外,每一个元素有且只有一个直接后继元素。 数据元素之间的关系是一对一的关系。
Operation(//建判清增删查长)
- InitList(*L): 初始化操作,建立一个空的线性表L。
- ListEmpty(L): 判断线性表是否为空表,若线性表为空,返回true,否则返回false。
- ClearList(*L): 将线性表清空。
- GetElem(L,i,*e): 将线性表L中的第i个位置(//从1开始)元素值返回给e。
- LocateElem(L,e): 在线性表L中查找与给定值e相等的元素,如果查找成功,返回该元素在表中序号;否则,返回0表示失败。若满足条件的元素不惟一,则返回最小的位序。(//从1开始)
- ListInsert(*L,i,e): 在线性表L中第i个位置插入新元素e。
- ListDelete(*L,i,*e): 删除线性表L中第i个位置元素,并用e返回其值。
- ListPrior (L, x):求前驱函数。当x在线性表L中,且其位序大于1,则函数值为x的直接前驱,否则为空元素。
- ListNext (L, x):求后继函数。当x在线性表L中,且其位序小于Length(L), 则函数值为x的直接后继,否则为空元素。
- ListLength(L): 返回线性表L的元素个数。
- endADT
对于不同的应用,线性表的基本操作是不同的,上述操作是最基本的,对于实际问题中涉及的关于线性表的更复杂操作,完全可以用这些基本操作的组合来实现。
例子:比如要实现两个线性表A、B的并集操作,即要使得集合A=A∪B。
解析:我们只需要循环遍历集合B中的每个元素,判断当前元素是否存在A中,弱不存在,则插入A中即可。
需要运用到几个基本的操作组合即可:
ListLength(L);
GetElem(L,i,*e);
LocateElem(L,e);
ListInsert(*L,i,e);//union表示并集, La表示A集合, Lb表示B集合。 void unionL(List *La, list Lb) { int La_len, Lb_len, i; ElemType e; La_len = ListLength(*La); Lb_len = ListLength(Lb); for( i=1; i <= Lb_len; i++ ) { GetElem(Lb, i, &e); if( !LocateElem(*La, e) ) { ListInsert(La, ++La_len, e); } } }
2.3 线性表的两种存储结构
2.3.1 顺序存储结构
1.定义
用一段地址连续的存储单元依次存储线性表的数据元素(a1,a2,…,an)。(类似数组)
代码:
#define MAXSIZE 20 typedef int ElemType; //可以不是int类型!!!ElemType代表线性表元素类型 typedef struct { ElemType data[MAXSIZE]; int length; // 线性表当前长度 } SqList; //我们封装了一个结构(事实上就是数组),增加了当前长度的变量。
顺序存储结构三个属性:
- 存储空间的起始位置,数组data,它的存储位置就是线性表存储空间的存储位置。
- 线性表的最大存储容量:数组的长度MaxSize。
线性表的当前长度:length。
附:线性表的当前长度是线性表中元素的个数,是会变化的。(数组不变)
2.定位操作
地址计算公式:
假设ElemType占用的是c个存储单元(字节),那么线性表中第i+1个数据元素和第i个数据元素的存储位置的关系是(LOC表示获得存储位置的函数): LOC(ai+1) = LOC(ai) + c
第i个数据元素ai的存储位置可以由a1推算得出: LOC(ai) = LOC(a1) + (i-1)*c
通过这个公式,我们可以随时计算出线性表中任意位置的地址,它的存储时间性能为0(1)。
实现GetElem(SqList L, int i, ElemType *e),即将线性表L中的第i个位置元素值返回(从1开始)。就程序而言只需要把数组第i-1下标的值返回即可(从0开始)。
代码:
#define OK 1 #define ERROR 0 #define TRUE 1 #define FALSE 0 typedef int Status; // 注意:这里返回值Status是一个整型,约定返回1代表OK,返回0代表ERROR。 // 初始条件:顺序线性表L已存在,1 <= i <= ListLength(L) // 操作结果:用ElemType型指针e返回L中第i个数据元素的值。 Status GetElem(SqList L, int i, ElemType *e) { if( L.length==0 || i<1 || i>L.length ) { return ERROR; } *e = L.data[i-1]; return OK; }
3.插入操作
实现ListInsert(*L, i, e),即在线性表L中的第i个位置插入新元素e
所以插入算法的思路:
- 如果插入位置不合理,抛出异常;
- 如果线性表长度大于等于数组长度,则抛出异常或动态增加数组容量;
- 从最后一个元素开始向前遍历到第i个位置,分别将它们都向后移动一个位置;
- 将要插入元素填入位置i处;
- 线性表长+1。
代码:
/* 初始条件:顺序线性表L已存在,1<=i<=ListLength(L)。 */ /* 操作结果:在L中第i个位置之前插入新的数据元素e,L长度+1。*/ Status ListInsert(SqList *L, int i, ElemType e) { int k; if( L->length == MAXSIZE ) // 顺序线性表已经满了 { return ERROR; } if( i<1 || i>L->length+1) // 当i不在范围内时 { return ERROR; } if( i <= L->length ) // 若插入数据位置不在表尾 {