说明:
本文主要展示Python实现的几种常用数据结构:顺序表、链表、栈和队列。
附有实现代码。
来源主要参考网络文章。
一、顺序表
1、顺序表的结构
一个顺序表的完整信息包括两部分,一部分是表中元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数两项。
2、顺序表的两种基本实现方式
图a 为一体式结构,存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的顺序表对象。一体式结构整体性强,易于管理。但是由于数据元素存储区域是表对象的一部分,顺序表创建后,元素存储区就固定了。
图b 为分离式结构,表对象里只保存与整个表有关的信息(容量和元素个数),实际数据元素存放在另一个独立的元素存储区里,通过链接与基本表对象关联。
3、元素存储区替换
一体式结构由于顺序表信息区与数据区联系存储在一起,所以若想更换数据区,则只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变了。
分离式结构若想更换数据区,只需将表信息区中的数据区链接地址更新即可,而该顺序表对象不变。
4、元素存储区扩充及其策略
分离式结构的顺序表,如想将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改。只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法进行。人们把采用这种技术实现的顺序表称为动态顺序表,因为其容量可以在使用中动态变化。
扩充的两种策略:
》每次扩充增加固定数目的存储位置,如每次扩充10个元素位置,这种策略可称为线性增长。
(特点:节省空间,但是扩充操作频繁,操作次数多)
》每次扩充容量加倍,如每次扩充增加一倍存储空间。
(特点:减少了扩充操作的执行次数,但可能会浪费空间资源。以空间换时间,推荐的方式)
》Python的官方实现中,list实现采用了如下的策略:在建立空表(或很小的表)时,系统分配一块能容纳8个元素的存储区;在执行插入操作(insert或append)时,如果元素存储区满就换一块4倍大的存储区。但如果此时的表已经很大(目前阀值为50000),则改变策略,采用加一倍的方法。引入这种改变策略的方式,是为了避免出现过多的空闲的存储位置。
5、顺序表的操作
增加元素,下图为顺序表增加元素的三种方式:
a、尾端加入元素,时间复杂度为 O(1)
b、非保序的加入元素(不常见)没时间复杂度为 O(1)
c、保序的元素加入,时间复杂度为 O(n)
删除元素,下图为顺序表删除元素的三种方式:
a、删除表尾元素,时间复杂度为 O(1)
b、非保序的元素删除(不常见),时间复杂度为 O(1)
c、保序的元素删除,时间复杂度为 O(n)
6、Python 中的顺序表
Python中的 list和 tuple两种类型采用了顺序表的实现技术,具有前面讨论的顺序表的所有性质。
tuple是不可变类型,即不变的顺序表,因此不支持改变其内部状态任何操作,而其他方面,则与list的性质类似。
list的基本实现技术:
Python表中类型list就是一种元素个数可变的线性表,可以加入和删除元素,并在各种操作维持已有元素顺序(即保序),而且还具有以下行为特征:
》基于下标(位置)的高效元素访问和更新,时间复杂度应该是 O(1);
为满足该特征,应该采用顺序表技术,表中元素保存在一块连续的存储区中。
》允许任意加入元素,而且在不断加入元素的过程中,表对象的标识(函数id得到的值)不变
为满足该特征,就必须能更换元素存储区,并且为保证更换存储区时list对象的标识id不变,只能采用分离式实现技术。
在Python官方实现中,list就是一种采用分离式技术实现的动态顺序表。这就是为什么用list.append(x)(或list.insert(len(list), x), 即尾部插入)比在指定位置插入元素效率高的原因。
二、链表
相对于顺序表,链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理,因为顺序表的结构需要预先知道数据大小来申请连续的存储空间,而在进行扩充时又需要进行数据的搬迁。
链表(Linked list)是一种常见的基础数据结构,是一种线性表,但是不像顺序表一样连续存储数据,而是每一个结点(数据存储单元)里存放下一个结点的信息(即地址):
1、单向链表
单向链表也叫单链表,是表中最简单的一种形式,它的每个节点包含两个域,一个信息域(元素域)和一个链接域。这个链接指向链表中的下一个节点,而最后一个节点的链接域则指向一个空值。
表中元素elem用来存放具体的数据。
链接域next用来存放下一个节点的位置(Python中的标识)。
变量p指向链表的头节点(首节点)的位置,从p出发能找到表中的任意节点。
单链表的操作:
is_empty():链表是否为空
length():链表长度
travel():遍历整个链表
add(item):链表头部添加元素
append(item):链表尾部添加元素
insert(pos, item):指定位置添加元素
remove(item):删除节点
search(item):查找节点是否存在
代码实现:
1 #coding=utf-8
2 #单链表的实现
3
4
5 classSingleNode:6 """单链表的节点"""
7 def __init__(self, item):8 #item存放数据元素
9 self.item =item10 #下一个节点
11 self.next =None12
13 def __str__(self):14 returnstr(self.item)15
16
17 classSingleLinkList:18 """单链表"""
19 def __init__(self):20 self._head =None21
22 defis_empty(self):23 """判断链表是否为空"""
24 return self._head isNone25
26 deflength(self):27 """获取链表长度"""
28 cur =self._head29 count =030 while cur is notNone:31 count += 1
32 #将cur后移,指向下一个节点
33 cur =cur.next34 returncount35
36 deftravel(self):37 """遍历链表"""
38 cur =self._head39 while cur is notNone:40 print(cur.item)41 cur =cur.next42 print("")43
44 defadd(self, item):45 """链表头部添加元素"""
46 node =SingleNode(item)47
48 node.next =self._head49 self._head =node50
51 defappend(self, item):52 """链表尾部添加元素"""
53 node =SingleNode(item)54
55 ifself.is_empty():56 self._head =node57 else:58 cur =self._head59 while cur.next is notNone:60 cur =cur.next61
62 #此时cur指向链表最后一个节点,即 next = None
63 cur.next =node64
65 definsert(self, pos, item):66 """指定位置添加元素"""
67 #若指定位置pos为第一个元素之前,则执行头部插入
68 if pos <=0:69 self.add(item)70
71 #若指定位置超过链表尾部,则执行尾部插入
72 elif pos > (self.length() - 1):73 self.append(item)74
75 #找到指定位置
76 else:77 node =SingleNode(item)78 cur =self._head79 cur_pos =080 while cur.next is notNone:81 #获取需要插入位置的上一个节点
82 if pos - 1 ==cur_pos:83 node.next =cur.next84 cur.next =node85 cur =cur.next86 cur_pos += 1
87
88 defremove(self, item):89 """删除节点"""
90 cur =self._head91 while cur is notNone:92 if cur.next.item ==item:93 cur.next =cur.next.next94 break
95 cur =cur.next96
97 defsearch(self, item):98 """查找节点是否存在"""
99 cur =self._head100 count =0101 while cur is notNone:102 if cur.item ==item:103 returncount104 cur =cur.next105 count += 1
106
107 #找不到元素
108 if count ==self.length():109 count = -1
110 returncount111
112
113 if __name__ == "__main__":114 ll =SingleLinkList()115 ll.add(1) #1
116 ll.add(2) #2 1
117 ll.append(3) #2 1 3
118 ll.insert(2, 4) #2 1 4 3
119 print("length:", ll.length()) #4
120 ll.travel() #2 1 4 3
121 print("search(3):", ll.search(3)) #3
122 print("search(5):", ll.search(5)) #-1
123 ll.remove(1)124 print("length:", ll.length()) #3
125 ll.travel() #2 4 3
链表与顺序表的对比:
链表失去了顺序表随机读取的优点,同时链表由于增加了节点的指针域,空间开销比较大,但对存储空间的使用要相对灵活。
链表与顺序表的各种操作复杂度如下所示:
操作
链表
顺序表
访问元素
O(n)
O(1)
在头部插入/删除
O(1)
O(n)
在尾部安插入/删除
O(n)
O(1)
在中间插入/删除
O(n)
O(n)
注意:虽然表面看起来复杂度都是 O(n),但是链表和顺序表在插入和删除时进行的是完全不同的操作。链表的主要耗时操作是遍历查找,删除和插入操作本身的复杂度是O(1)。顺序表查找很快,主要耗时的操作是拷贝覆盖。因为除了目标元素在尾部的特殊情况,顺序表进行插入和删除时需要对操作点之后所有元素进行前后移位操作,只能通过拷贝和覆盖方法进行。
2、单向循环链表
单链表的一个变形是单向循环链表,链表中最后一个节点的next域不再为None,而是指向链表的头结点。
基本操作和单链表基本一样,实现代码如下:
1 #coding=utf-8
2 #单向循环链表
3
4
5 classNode:6 """节点"""
7 def __init__(self, item):8 self.item =item9 self.next =None10
11 def __str__(self):12 returnstr(self.item)13
14
15 classSinCycLinkedList:16 """单向循环链表"""
17 def __init__(self):18 self._head =None19
20 defis_empty(self):21 """判断链表是否为空"""
22 return self._head isNone23
24 deflength(self):25 """链表长度"""
26 ifself.is_empty():27 return028 count = 1
29 cur =self._head30 while cur.next !=self._head:31 #print("cur", cur.item)
32 count += 1
33 cur =cur.next34 returncount35
36 deftravel(self):37 """遍历"""
38 ifself.is_empty():39 return
40
41 cur =self._head42 print(cur.item)43 while cur.next !=self._head:44 cur =cur.next45 print(cur.item)46
47 defadd(self, item):48 """在头部添加一个节点"""
49 node =Node(item)50 ifself.is_empty():51 self._head =node52 node.next =self._head53 else:54 node.next =self._head55 cur =self._head56 while cur.next !=self._head:57 cur =cur.next58
59 cur.next =node60 self._head =node61
62 defappend(self, item):63 """在尾部添加一个节点"""
64 node =Node(item)65 ifself.is_empty():66 self._head =node67 node.next =self._head68 else:69 cur =self._head70 #print(type(cur), cur.item, cur.next)
71 while cur.next !=self._head:72 cur =cur.next73
74 #print(cur.item)
75 cur.next =node76 node.next =self._head77
78 definsert(self, pos, item):79 """指定位置pos添加节点"""
80 if pos <=0:81 self.add(item)82 elif pos > (self.length() - 1):83 self.append(item)84 else:85 node =Node(item)86 cur =self._head87 cur_pos =088 while cur.next !=self._head:89 if (pos - 1) ==cur_pos:90 node.next =cur.next91 cur.next =node92 break
93 cur_pos += 1
94 cur =cur.next95
96 defremove(self, item):97 """删除一个节点"""
98 ifself.is_empty():99 return
100
101 pre =self._head102 #删除首节点
103 if pre.item ==item:104 cur =pre105 while cur.next !=self._head:106 cur =cur.next107
108 cur.next = pre.next #删除首节点(跳过该节点)
109 self._head = pre.next #重新指定首节点
110
111 #删除其他的节点
112 else:113 cur =pre114 while cur.next !=self._head:115 if cur.next.item ==item:116 cur.next =cur.next.next117 cur =cur.next118
119 defsearch(self, item):120 """查找节点是否存在"""
121 ifself.is_empty():122 return -1
123
124 cur_pos =0125 cur =self._head126 if cur.item ==item:127 returncur_pos128
129 while cur.next !=self._head:130 if cur.item ==item:131 returncur_pos132 cur_pos += 1
133 cur =cur.next134
135 if cur_pos == self.length() - 1:136 return -1
137
138
139 if __name__ == "__main__":140 ll =SinCycLinkedList()141 ll.add(1) #1
142 ll.add(2) #2 1
143 #ll.travel()
144 ll.append(3) #2 1 3
145 ll.insert(2, 4) #2 1 4 3
146 ll.insert(4, 5) #2 1 4 3 5
147 ll.insert(0, 6) #6 2 1 4 3 5
148 print("length:", ll.length()) #6
149 ll.travel() #6 2 1 4 3 5
150 print("search(3)", ll.search(3)) #4
151 print("search(7)", ll.search(7)) #-1
152 print("search(6)", ll.search(6)) #0
153 print("remove(1)")154 ll.remove(1)155 print("length:", ll.length()) #6 2 4 3 5
156 print("remove(6)")157 ll.remove(6)158 ll.travel()
3、双向链表
一种更复杂的链表是 "双向链表" 或 "双面链表"。每个节点有两个链接:一个指向前一个节点,当次节点为第一个节点时,指向空值;而另一个指向下一个节点,当此节点为最后一个节点时,指向空值。
基本操作和单链表一样,不同的实现,代码如下:
1 #coding=utf-8
2 #双向链表
3
4
5 classNode:6 """节点"""
7 def __init__(self, item):8 self.item =item9 self.prev =None10 self.next =None11
12
13 classDLinkList:14 """双向链表"""
15 def __init__(self):16 self._head =None17
18 defis_empty(self):19 """判断链表是否为空"""
20 return self._head isNone21
22 deflength(self):23 """获取链表长度"""
24 ifself.is_empty():25 return026 else:27 cur =self._head28 count = 1
29 while cur.next is notNone:30 count += 1
31 cur =cur.next32
33 returncount34
35 deftravel(self):36 """遍历链表"""
37 print("↓↓" * 10)38 ifself.is_empty():39 print("")40
41 else:42 cur =self._head43 print(cur.item)44 while cur.next is notNone:45 cur =cur.next46 print(cur.item)47 print("↑↑" * 10)48
49 defadd(self, item):50 """链表头部添加节点"""
51 node =Node(item)52 ifself.is_empty():53 self._head =node54 else:55 cur =self._head56
57 node.next =cur58 cur.prev =node59 self._head =node60
61 defappend(self, item):62 """链表尾部添加节点"""
63 node =Node(item)64 ifself.is_empty():65 self._head =node66 else:67 cur =self._head68 #遍历找到最后一个节点
69 while cur.next is notNone:70 cur =cur.next71
72 #在尾节点添加新的节点
73 cur.next =node74 node.prev =cur75
76 definsert(self, pos, item):77 """指定位置添加"""
78 #头部添加
79 if pos <=0:80 self.add(item)81
82 #尾部添加
83 elif pos > (self.length() - 1):84 self.append(item)85
86 #其他位置添加
87 else:88 node =Node(item)89
90 cur =self._head91 cur_pos =092 while cur.next is notNone:93 if cur_pos == (pos - 1):94 #与下一个节点互相指向
95 node.next =cur.next96 cur.next.prev =node97 #与上一个节点互相指向
98 cur.next =node99 node.prev =cur100 cur_pos += 1
101 cur =cur.next102
103 defremove(self, item):104 """删除节点"""
105 ifself.is_empty():106 return
107 else:108 cur =self._head109 #删除首节点
110 if cur.item ==item:111 self._head =cur.next112 cur.next.prev =None113
114 #删除其他节点
115 else:116 while cur.next is notNone:117 if cur.item ==item:118 #删除之前:1 ←→ [2] ←→ 3
119 #删除之后:1 ←→ 3
120 cur.prev.next =cur.next121 cur.next.prev =cur.prev122 cur =cur.next123
124 #删除尾节点
125 if cur.item ==item:126 cur.prev.next =None127
128
129 defsearch(self, item):130 """查找节点是否存在"""
131 ifself.is_empty():132 return -1
133 else:134 cur =self._head135 cur_pos =0136 while cur.next is notNone:137 if cur.item ==item:138 returncur_pos139
140 cur_pos += 1
141 cur =cur.next142
143 if cur_pos == (self.length() - 1):144 return -1
145
146
147 if __name__ == "__main__":148 ll =DLinkList()149 ll.add(1) #1
150 ll.add(2) #2 1
151 ll.append(3) #2 1 3
152 ll.insert(2, 4) #2 1 4 3
153 ll.insert(4, 5) #2 1 4 3 5
154 ll.insert(0, 6) #6 2 1 4 3 5
155 print("length:", ll.length()) #6
156 ll.travel() #6 2 1 4 3 5
157 print("search(3)", ll.search(3))158 print("search(4)", ll.search(4))159 print("search(10)", ll.search(10))160 ll.remove(1)161 print("length:", ll.length())162 ll.travel()163 print("删除首节点 remove(6):")164 ll.remove(6)165 ll.travel()166 print("删除尾节点 remove(5):")167 ll.remove(5)168 ll.travel()
三、栈
栈(stack),也称为堆栈,是一种容器,可存入数据元素、访问元素、删除元素,它的特点在于只能允许在容器的一端(称为栈顶端指标:top)进行加入数据(push)和输出数据(pop)的运算。没有了位置概念,保证任何时候可以访问、删除的元素都是此前最后存入的那个元素,确定了一种默认的访问顺序。
由于栈数据结构只允许在一端进行操作,因为按照后进先出(LIFO,Last In First Out)的原理运作。
栈可以用顺序表实现,也可以用链表实现。
1、栈的操作:
Stack():创建一个新的空栈
push(item):添加一个新的元素item到栈顶
pop():弹出栈顶元素
peek():返回栈顶元素
is_empty():判断栈是否为空
size():返回栈的元素个数
2、代码实现
1 #coding=utf-8
2
3
4 classStack:5 """栈"""
6 def __init__(self):7 self.items =[]8
9 defis_empty(self):10 """判断是否为空"""
11 return self.items ==[]12
13 defpush(self, item):14 """加入元素"""
15 self.items.append(item)16
17 defpop(self):18 """弹出元素"""
19 returnself.items.pop()20
21 defpeek(self):22 """返回栈顶元素"""
23 return self.items[len(self.items) - 1]24
25 defsize(self):26 """返回栈的元素个数"""
27 returnlen(self.items)28
29
30 if __name__ == "__main__":31 stack =Stack()32 stack.push("hello")33 stack.push("world")34 stack.push("stack")35 print(stack.size()) #3
36 print(stack.peek()) #stack
37 print(stack.pop()) #stack
38 print(stack.pop()) #world
39 print(stack.pop()) #hello
四、队列
队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。
队列是一种先进先出(FIFO,First In First Out)的线性表。允许插入的一端为队尾,允许删除的一端为队头。队列不允许在中间部位进行操作!假设队列 q=(a1, a2, ,..., an),那么a1就是队头元素,而an是队尾元素。这样在删除时,总是从a1开始,而插入时,总是在队列最后。
1、队列的实现(同栈一样,队列也可以用顺序表或者链表实现):
队列的操作:
Queue():创建一个空的队列
enqueue(item):往队列中添加一个item元素
dequeue():从队列头部删除一个元素
is_empty():判断一个队列是否为空
size():返回队列的大小
1 #coding=utf-8
2
3
4 classQueue:5 """队列"""
6 def __init__(self):7 self.items =[]8
9 defis_empty(self):10 return self.items ==[]11
12 defenqueue(self, item):13 """添加元素"""
14 self.items.insert(0, item)15
16 defdequeue(self):17 """从队列头部删除一个元素"""
18 returnself.items.pop()19
20 defsize(self):21 returnlen(self.items)22
23
24 if __name__ == "__main__":25 q =Queue()26 q.enqueue("hello")27 q.enqueue("world")28 q.enqueue("queue")29 print(q.size())30 print(q.dequeue()) #hello
31 print(q.dequeue()) #world
32 print(q.dequeue()) #queue
2、双端队列的实现
双端队列(deque,全名 double-ended queue),是一种具有队列和栈的性质的数据结构。
双端队列中的元素可以从两端弹出,其限定插入和删除操作在表的两端进行。双端队列可以在队列任意一端入队和出队。
操作:
Deque():创建一个空的双端队列
add_front(item):从队头加入一个item元素
add_rear(item):从队尾加入一个item元素
remove_front():从队头删除一个元素
remove_rear():从队尾删除一个元素
is_empty():判断双端队列是否为空
size():返回队列的大小
1 #coding=utf-8
2
3
4 classDeque:5 """双端队列"""
6 def __init__(self):7 self.items =[]8
9 defadd_front(self, item):10 """从队头加入一个元素"""
11 self.items.insert(0, item)12
13 defadd_rear(self, item):14 """从队尾加入一个元素"""
15 self.items.append(item)16
17 defremove_front(self):18 """从队头删除一个元素"""
19 returnself.items.pop(0)20
21 defremove_rear(self):22 """从队尾删除一个元素"""
23 returnself.items.pop()24
25 defis_empty(self):26 """是否为空"""
27 return self.items ==[]28
29 defsize(self):30 """队列长度"""
31 returnlen(self.items)32
33
34 if __name__ == "__main__":35 deque =Deque()36 deque.add_front(1)37 deque.add_front(2)38 deque.add_rear(3)39 deque.add_rear(4)40 print(deque.size()) #4
41 print(deque.remove_front()) #2
42 print(deque.remove_front()) #1
43 print(deque.remove_rear()) #4
44 print(deque.remove_rear()) #3