阶段2_数据结构与算法04_搜索

最新推荐文章于 2021-05-26 19:36:30 发布

SayakaNayuki

最新推荐文章于 2021-05-26 19:36:30 发布

阅读量363

点赞数

分类专栏：阶段2_数据结构和算法

本文链接：https://blog.csdn.net/qq_43323369/article/details/105940584

版权

阶段2_数据结构和算法专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章目录

二分查找

二分查找又称折半查找，优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步查找前一子表，否则进一步查找后一子表。重复以上过程，直到找到满足条件的记录，使查找成功，或直到子表不存在为止，此时查找不成功。

中间元素的坐标是头部元素的坐标加尾部元素的坐标,除以2取整数

代码:

递归版本

def binary_search1(list, item):
    n = len(list)
    if n > 0:
        mid = n // 2
        if list[mid] == item:
            return True
        elif item < list[mid]:
            return binary_search1(list[:mid], item)
        else:
            return binary_search1(list[mid+1:], item)
    return False

if __name__ == '__main__':
    list = [17, 20, 30, 40, 50, 60]
    print(binary_search1(list, 17))
    print(binary_search1(list, 41))

非递归版本

def binary_search2(list, item):
    n = len(list)
    first = 0
    last = n - 1
    while first <= last:
        mid = (first + last) // 2
        if list[mid] == item:
            return True
        elif item < list[mid]:
            last = mid - 1
        else:
            first = mid + 1
    return False

if __name__ == '__main__':
    list = [17, 20, 30, 40, 50, 60]
    print(binary_search2(list, 17))
    print(binary_search2(list, 41))

输出结果

True
False

最优时间复杂度：O(1)
最坏时间复杂度：O(logn)

树

树的概念

树（英语：tree）是一种抽象数据类型（ADT）或是实作这种抽象数据类型的数据结构，用来模拟具有树状结构性质的数据集合。它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：

每个节点有零个或多个***子节点***；(比如说保定就没有子节点)
没有父节点的节点称为***根节点***；(保定是一个根节点)
每一个非根节点有且只有一个***父节点***；
除了根节点外，每个子节点可以分为多个不相交的子树；(比如说河北,保定,石家庄是一棵树,山东,青岛,济南是另一棵树)

例如

在这里插入图片描述

树的术语

节点的度：一个节点含有的子树的个数称为该节点的度；(实际上就是一个节点含有的子节点的个数)
树的度：一棵树中，最大的节点的度称为树的度；(上图的树的度为3)
叶节点或终端节点：度为零的节点；(例如保定,广州就是叶节点)
父亲节点或父节点：若一个节点含有子节点，则这个节点称为其子节点的父节点；
孩子节点或子节点：一个节点含有的子树的根节点称为该节点的子节点；
兄弟节点：具有相同父节点的节点互称为兄弟节点；(例如保定和石家庄是兄弟节点)
节点的层次：从根开始定义起，根为第1层，根的子节点为第2层，以此类推；
树的高度或深度：树中节点的最大层次；(上图的树的深度是3)
堂兄弟节点：父节点在同一层的节点互为堂兄弟节点；
节点的祖先：从根到该节点所经分支上的所有节点；(例如广州的祖先是广东,中国)
子孙：以某节点为根的子树中任一节点都称为该节点的子孙。
森林：由m（m>=0）棵互不相交的树的集合称为森林；

树的种类

无序树：树中任意节点的子节点之间没有顺序关系，这种树称为无序树，也称为自由树；(没有研究价值)
有序树：树中任意节点的子节点之间有顺序关系，这种树称为有序树；
- 二叉树：每个节点最多含有两个子树的树称为二叉树；
  - 完全二叉树：对于一颗二叉树，假设其深度为d(d>1)。除了第d层外，其它各层的节点数目均已达最大值，且第d层所有节点从左向右连续地紧密排列，这样的二叉树被称为完全二叉树，其中满二叉树的定义是所有叶节点都在最底层的完全二叉树;
  - 平衡二叉树（AVL树）：当且仅当任何节点的两棵子树的高度差不大于1的二叉树；
  - 排序二叉树（二叉查找树（英语：Binary Search Tree），也称二叉搜索树、有序二叉树）；
- 霍夫曼树（用于信息编码）：带权路径最短的二叉树称为哈夫曼树或最优二叉树；
- B树：一种对读写操作进行优化的自平衡的二叉查找树，能够保持数据有序，拥有多余两个子树。

(1)完全二叉树

(2)满二叉树

(3)平衡二叉树

如果去掉E,J,那么B节点的左侧子树深度为2,右侧子树深度为0,不是平衡二叉树;如果去掉J,就是平衡二叉树

(4)排序二叉树

对于任何一个节点来说,所有左边子节点的值都会比它小,所有右边子节点的值都会比它大

树的存储和应用场景

**顺序存储：**将数据结构存储在固定的数组中，然在遍历速度上有一定的优势，但因所占空间比较大，是非主流二叉树。二叉树通常以链式存储。(不常用)

在这里插入图片描述

链式存储：

在这里插入图片描述

树的应用场景:

1.xml，html等，那么编写这些东西的解析器的时候，不可避免用到树
2.路由协议就是使用了树的算法
3.mysql数据库索引
4.文件系统的目录结构
5.所以很多经典的AI算法其实都是树搜索，此外机器学习中的decision tree也是树结构

二叉树

二叉树的概念和性质

二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”（left subtree）和“右子树”（right subtree）

性质:(不作证明)

性质1: 在二叉树的第i层上至多有2^(i-1)个结点（i>0）
性质2: 深度为k的二叉树至多有2^k - 1个结点（k>0）
性质3: 对于任意一棵二叉树，如果其叶结点数为N0，而度数为2的结点总数为N2，则N0=N2+1;
**性质4:**具有n个结点的完全二叉树的深度必为 log<sub>2</sub>(n+1)(联系性质2)
**性质5:**对完全二叉树，若从上至下、从左至右编号，则编号为i 的结点，其左孩子编号必为2i，其右孩子编号必为2i＋1；其双亲的编号必为i/2（i＝1 时为根,除外）

二叉树的代码实现

要创建二叉树首先要定义一个节点类和一个树类,要在二叉树中添加节点,需要使用层次遍历的方法,给定一个如下图所示的二叉树

在这里插入图片描述

想要找到这棵树需要添加节点的位置,需要逐层寻找,然后添加到E的右子节点的位置,首先要看A节点,A节点有B和C两个节点,然后看第二层,先看B节点,再看C节点,第二层看完了看第三层,一直找到E节点的右节点是空缺的,这种遍历的方式叫做广度优先遍历(层次遍历),广度指的就是横向

遍历的过程中开始找到的是A节点,发现A的两个子节点都存在,取出A,然后添加A的两个子节点,序列变为[B, C],处理A之后处理B,B的两个子节点存在,取出B,添加B的两个子节点,序列变为[C, D, E],这个时候AB都处理完了,然后处理C,取出C,然后添加它的两个子节点,序列变为[D, E, F, G],这样一直进行下去,始终都是右边补充元素,左边取出元素,可以联想到队列

代码实现

class Node(object):
    def __init__(self, item):
        # 存储数据
        self.elem = item
        # 存储子节点
        self.lchild = None
        self.rchild = None

class Tree(object):
    """二叉树"""
    def __init__(self):
        self.root = None
	# 添加节点
    def add(self, item):
        node = Node(item)
        # 队列用来记录要处理的节点
        queue = [self.root]
        # 特殊情况,根节点为空
        if self.root is None:
            self.root = node
            return
        while queue:
            cur_node = queue.pop(0)
            # 如果左节点为空,把新建的节点挂在上面
            if cur_node.lchild is None:
                cur_node.lchild = node
                return
            else:
                # 如果左节点存在
                # 将左节点添加到队列中
                queue.append(cur_node.lchild)
            if cur_node.rchile is None:
                cur_node.rchild = node
                return
            else:
                queue.append(cur_node.rchild)

tree = Tree()

二叉树的遍历

广度优先遍历:

def breadth_travel(self):
    queue = [self.root]
    if self.root is None:
        return
    while queue:
        cur_node = queue.pop(0)
        print(cur_node.elem)
        if cur_node.lchild is not None:
            queue.append(cur_node.lchild)
        if cur_node.rchild is not None:
            queue.append(cur_node.rchild)

深度优先遍历:

对于一颗二叉树，深度优先搜索(Depth First Search)是沿着树的深度遍历树的节点，尽可能深的搜索树的分支。
那么深度遍历有重要的三种方法。这三种方式常被用于访问树的节点，它们之间的不同在于访问每个节点的次序不同。这三种遍历分别叫做***先序遍历***（preorder），中序遍历（inorder）和后序遍历（postorder）。我们来给出它们的详细定义，然后举例看看它们的应用。

先序遍历在先序遍历中，我们先访问根节点，然后递归使用先序遍历访问左子树，再递归使用先序遍历访问右子树

根节点->左子树->右子树

def preorder(self, root):
      """递归实现先序遍历"""
      if root == None:
          return
      print root.elem
      self.preorder(root.lchild)
      self.preorder(root.rchild)

中序遍历在中序遍历中，我们递归使用中序遍历访问左子树，然后访问根节点，最后再递归使用中序遍历访问右子树

左子树->根节点->右子树

def inorder(self, root):
      """递归实现中序遍历"""
      if root == None:
          return
      self.inorder(root.lchild)
      print root.elem
      self.inorder(root.rchild)

后序遍历在后序遍历中，我们先递归使用后序遍历访问左子树和右子树，最后访问根节点

左子树->右子树->根节点

def postorder(self, root):
      """递归实现后续遍历"""
      if root == None:
          return
      self.postorder(root.lchild)
      self.postorder(root.rchild)
      print root.elem

代码汇总

class Node(object):
    def __init__(self, item):
        # 存储数据
        self.elem = item
        # 存储子节点
        self.lchild = None
        self.rchild = None

class Tree(object):
    """二叉树"""
    def __init__(self):
        self.root = None

    def add(self, item):
        node = Node(item)
        # 队列用来记录要处理的节点
        queue = [self.root]
        # 特殊情况,根节点为空
        if self.root is None:
            self.root = node
            return
        while queue:
            cur_node = queue.pop(0)
            if cur_node.lchild is None:
                cur_node.lchild = node
                return
            else:
                queue.append(cur_node.lchild)
            if cur_node.rchild is None:
                cur_node.rchild = node
                return
            else:
                queue.append(cur_node.rchild)

    def breadth_travel(self):
        queue = [self.root]
        if self.root is None:
            return
        while queue:
            cur_node = queue.pop(0)
            print(cur_node.elem, end='\t')
            if cur_node.lchild is not None:
                queue.append(cur_node.lchild)
            if cur_node.rchild is not None:
                queue.append(cur_node.rchild)

    def preorder(self, node):
        if node is None:
            return
        print(node.elem, end='\t')
        self.preorder(node.lchild)
        self.preorder(node.rchild)

    def inorder(self, node):
        if node is None:
            return
        self.inorder(node.lchild)
        print(node.elem, end='\t')
        self.inorder(node.rchild)

    def postorder(self, node):
        if node is None:
            return
        self.postorder(node.lchild)
        self.postorder(node.rchild)
        print(node.elem, end='\t')


if __name__ == '__main__':
    tree = Tree()
    tree.add(0)
    tree.add(1)
    tree.add(2)
    tree.add(3)
    tree.add(4)
    tree.add(5)
    tree.add(6)
    tree.add(7)
    tree.add(8)
    tree.add(9)
    tree.breadth_travel()
    print('')
    tree.preorder(tree.root)
    print('')
    tree.inorder(tree.root)
    print('')
    tree.postorder(tree.root)

输出结果

0	1	2	3	4	5	6	7	8	9	
0	1	3	7	8	4	9	2	5	6	
7	3	8	1	9	4	0	5	2	6	
7	8	3	9	4	1	5	6	2	0

SayakaNayuki

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
阶段2_数据结构与算法04_搜索

阶段2_数据结构与算法04_搜索文章目录阶段2\_数据结构与算法04\_搜索二分查找二分查找二分查找又称折半查找，优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个...
复制链接

扫一扫

专栏目录