二分查找
二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
中间元素的坐标是头部元素的坐标加尾部元素的坐标,除以2取整数
代码:
递归版本
def binary_search1(list, item):
n = len(list)
if n > 0:
mid = n // 2
if list[mid] == item:
return True
elif item < list[mid]:
return binary_search1(list[:mid], item)
else:
return binary_search1(list[mid+1:], item)
return False
if __name__ == '__main__':
list = [17, 20, 30, 40, 50, 60]
print(binary_search1(list, 17))
print(binary_search1(list, 41))
非递归版本
def binary_search2(list, item):
n = len(list)
first = 0
last = n - 1
while first <= last:
mid = (first + last) // 2
if list[mid] == item:
return True
elif item < list[mid]:
last = mid - 1
else:
first = mid + 1
return False
if __name__ == '__main__':
list = [17, 20, 30, 40, 50, 60]
print(binary_search2(list, 17))
print(binary_search2(list, 41))
输出结果
True
False
- 最优时间复杂度:O(1)
- 最坏时间复杂度:O(logn)
树
树的概念
树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:
- 每个节点有零个或多个***子节点***;(比如说保定就没有子节点)
- 没有父节点的节点称为***根节点***;(保定是一个根节点)
- 每一个非根节点有且只有一个***父节点***;
- 除了根节点外,每个子节点可以分为多个不相交的子树;(比如说河北,保定,石家庄是一棵树,山东,青岛,济南是另一棵树)
例如
树的术语
- 节点的度:一个节点含有的子树的个数称为该节点的度;(实际上就是一个节点含有的子节点的个数)
- 树的度:一棵树中,最大的节点的度称为树的度;(上图的树的度为3)
- 叶节点或终端节点:度为零的节点;(例如保定,广州就是叶节点)
- 父亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点;
- 孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点;
- 兄弟节点:具有相同父节点的节点互称为兄弟节点;(例如保定和石家庄是兄弟节点)
- 节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
- 树的高度或深度:树中节点的最大层次;(上图的树的深度是3)
- 堂兄弟节点:父节点在同一层的节点互为堂兄弟节点;
- 节点的祖先:从根到该节点所经分支上的所有节点;(例如广州的祖先是广东,中国)
- 子孙:以某节点为根的子树中任一节点都称为该节点的子孙。
- 森林:由m(m>=0)棵互不相交的树的集合称为森林;
树的种类
- 无序树:树中任意节点的子节点之间没有顺序关系,这种树称为无序树,也称为自由树;(没有研究价值)
- 有序树:树中任意节点的子节点之间有顺序关系,这种树称为有序树;
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
- 完全二叉树:对于一颗二叉树,假设其深度为d(d>1)。除了第d层外,其它各层的节点数目均已达最大值,且第d层所有节点从左向右连续地紧密排列,这样的二叉树被称为完全二叉树,其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;
- 平衡二叉树(AVL树):当且仅当任何节点的两棵子树的高度差不大于1的二叉树;
- 排序二叉树(二叉查找树(英语:Binary Search Tree),也称二叉搜索树、有序二叉树);
- 霍夫曼树(用于信息编码):带权路径最短的二叉树称为哈夫曼树或最优二叉树;
- B树:一种对读写操作进行优化的自平衡的二叉查找树,能够保持数据有序,拥有多余两个子树。
- 二叉树:每个节点最多含有两个子树的树称为二叉树;
(1)完全二叉树
(2)满二叉树
(3)平衡二叉树
如果去掉E,J,那么B节点的左侧子树深度为2,右侧子树深度为0,不是平衡二叉树;如果去掉J,就是平衡二叉树
(4)排序二叉树
对于任何一个节点来说,所有左边子节点的值都会比它小,所有右边子节点的值都会比它大
树的存储和应用场景
**顺序存储:**将数据结构存储在固定的数组中,然在遍历速度上有一定的优势,但因所占空间比较大,是非主流二叉树。二叉树通常以链式存储。(不常用)
链式存储:
树的应用场景:
1.xml,html等,那么编写这些东西的解析器的时候,不可避免用到树
2.路由协议就是使用了树的算法
3.mysql数据库索引
4.文件系统的目录结构
5.所以很多经典的AI算法其实都是树搜索,此外机器学习中的decision tree也是树结构
二叉树
二叉树的概念和性质
二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)
性质:(不作证明)
性质1: 在二叉树的第i
层上至多有2^(i-1)
个结点(i>0)
性质2: 深度为k的二叉树至多有2^k - 1
个结点(k>0)
性质3: 对于任意一棵二叉树,如果其叶结点数为N0
,而度数为2的结点总数为N2
,则N0=N2+1
;
**性质4:**具有n个结点的完全二叉树的深度必为 log<sub>2</sub>(n+1)
(联系性质2)
**性质5:**对完全二叉树,若从上至下、从左至右编号,则编号为i 的结点,其左孩子编号必为2i,其右孩子编号必为2i+1
;其双亲的编号必为i/2
(i=1
时为根,除外)
二叉树的代码实现
要创建二叉树首先要定义一个节点类和一个树类,要在二叉树中添加节点,需要使用层次遍历的方法,给定一个如下图所示的二叉树
想要找到这棵树需要添加节点的位置,需要逐层寻找,然后添加到E的右子节点的位置,首先要看A节点,A节点有B和C两个节点,然后看第二层,先看B节点,再看C节点,第二层看完了看第三层,一直找到E节点的右节点是空缺的,这种遍历的方式叫做广度优先遍历(层次遍历),广度指的就是横向
遍历的过程中开始找到的是A节点,发现A的两个子节点都存在,取出A,然后添加A的两个子节点,序列变为[B, C]
,处理A之后处理B,B的两个子节点存在,取出B,添加B的两个子节点,序列变为[C, D, E]
,这个时候AB都处理完了,然后处理C,取出C,然后添加它的两个子节点,序列变为[D, E, F, G]
,这样一直进行下去,始终都是右边补充元素,左边取出元素,可以联想到队列
代码实现
class Node(object):
def __init__(self, item):
# 存储数据
self.elem = item
# 存储子节点
self.lchild = None
self.rchild = None
class Tree(object):
"""二叉树"""
def __init__(self):
self.root = None
# 添加节点
def add(self, item):
node = Node(item)
# 队列用来记录要处理的节点
queue = [self.root]
# 特殊情况,根节点为空
if self.root is None:
self.root = node
return
while queue:
cur_node = queue.pop(0)
# 如果左节点为空,把新建的节点挂在上面
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
# 如果左节点存在
# 将左节点添加到队列中
queue.append(cur_node.lchild)
if cur_node.rchile is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
tree = Tree()
二叉树的遍历
广度优先遍历:
def breadth_travel(self):
queue = [self.root]
if self.root is None:
return
while queue:
cur_node = queue.pop(0)
print(cur_node.elem)
if cur_node.lchild is not None:
queue.append(cur_node.lchild)
if cur_node.rchild is not None:
queue.append(cur_node.rchild)
深度优先遍历:
对于一颗二叉树,深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点,尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点,它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做***先序遍历***(preorder),中序遍历(inorder)和后序遍历(postorder)。我们来给出它们的详细定义,然后举例看看它们的应用。
-
先序遍历 在先序遍历中,我们先访问根节点,然后递归使用先序遍历访问左子树,再递归使用先序遍历访问右子树
根节点->左子树->右子树
def preorder(self, root): """递归实现先序遍历""" if root == None: return print root.elem self.preorder(root.lchild) self.preorder(root.rchild)
-
中序遍历 在中序遍历中,我们递归使用中序遍历访问左子树,然后访问根节点,最后再递归使用中序遍历访问右子树
左子树->根节点->右子树
def inorder(self, root): """递归实现中序遍历""" if root == None: return self.inorder(root.lchild) print root.elem self.inorder(root.rchild)
-
后序遍历 在后序遍历中,我们先递归使用后序遍历访问左子树和右子树,最后访问根节点
左子树->右子树->根节点
def postorder(self, root): """递归实现后续遍历""" if root == None: return self.postorder(root.lchild) self.postorder(root.rchild) print root.elem
代码汇总
class Node(object):
def __init__(self, item):
# 存储数据
self.elem = item
# 存储子节点
self.lchild = None
self.rchild = None
class Tree(object):
"""二叉树"""
def __init__(self):
self.root = None
def add(self, item):
node = Node(item)
# 队列用来记录要处理的节点
queue = [self.root]
# 特殊情况,根节点为空
if self.root is None:
self.root = node
return
while queue:
cur_node = queue.pop(0)
if cur_node.lchild is None:
cur_node.lchild = node
return
else:
queue.append(cur_node.lchild)
if cur_node.rchild is None:
cur_node.rchild = node
return
else:
queue.append(cur_node.rchild)
def breadth_travel(self):
queue = [self.root]
if self.root is None:
return
while queue:
cur_node = queue.pop(0)
print(cur_node.elem, end='\t')
if cur_node.lchild is not None:
queue.append(cur_node.lchild)
if cur_node.rchild is not None:
queue.append(cur_node.rchild)
def preorder(self, node):
if node is None:
return
print(node.elem, end='\t')
self.preorder(node.lchild)
self.preorder(node.rchild)
def inorder(self, node):
if node is None:
return
self.inorder(node.lchild)
print(node.elem, end='\t')
self.inorder(node.rchild)
def postorder(self, node):
if node is None:
return
self.postorder(node.lchild)
self.postorder(node.rchild)
print(node.elem, end='\t')
if __name__ == '__main__':
tree = Tree()
tree.add(0)
tree.add(1)
tree.add(2)
tree.add(3)
tree.add(4)
tree.add(5)
tree.add(6)
tree.add(7)
tree.add(8)
tree.add(9)
tree.breadth_travel()
print('')
tree.preorder(tree.root)
print('')
tree.inorder(tree.root)
print('')
tree.postorder(tree.root)
输出结果
0 1 2 3 4 5 6 7 8 9
0 1 3 7 8 4 9 2 5 6
7 3 8 1 9 4 0 5 2 6
7 8 3 9 4 1 5 6 2 0