数据结构基础笔记(8)树和二叉树

最新推荐文章于 2024-03-06 09:55:02 发布

qq_43689216

最新推荐文章于 2024-03-06 09:55:02 发布

阅读量113

点赞数

分类专栏：自学笔记文章标签：数据结构二叉树算法

本文链接：https://blog.csdn.net/qq_43689216/article/details/109363269

版权

自学笔记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

树和二叉树：分支关系与层次结构下，如何有效实现增删查？
1.树是什么？
1.1.二叉树是什么？
在二叉树中，每个结点最多有两个分支，即每个结点最多有两个子结点，分别称作左子结点和右子结点。
存储二叉树有两种办法：
链式存储法也就是像链表一样，每个结点有三个字段，一个存储数据，另外两个分别存放指向左右子结点的指针。
顺序存储法就是按照规律把结点存放在数组里，为了方便计算，会约定把根结点放在下标为1的位置。随后，B结点放在下标为2的位置。
根据这种存储方式，我们发现如果结点X的下标为i，那么X的左子结点总是存放在2i的位置，X的右子结点总是存放在2i+1的位置。
之所以称为完全二叉树，是从存储空间利用效率的视角来看的。对于一棵完全二叉树而言，仅仅浪费了下标为0的存储位置。而如果是一颗非完全二叉树，咋会浪费大量的存储空间。
2.树的基本操作
树结构是一对多的关系，即前面的父节点与下面若干子结点产生了连接关系。
遍历一棵树，有三种方法：前序遍历、中序遍历、后序遍历。这里的序指的是父节点的遍历顺序，前序就是先遍历父节点，中序就是中间遍历父结点，后续就是最后遍历父结点。不管哪种遍历，都是通过递归调用完成的。
如下图所示：
前序遍历，对树中的任意结点来说，先打印这个结点，然后前序遍历它的左子树，最后前序遍历它的右子树。
中序遍历，对树中的任意结点来说，先中序遍历它的左子树，然后打印这个结点，最后中序遍历它的右子树。
后序遍历，对树中任意节点来说，先后序遍历它的左子树，再后序遍历它的右子树，最后打印本身，代码如下：

// 先序遍历

public static void preOrderTraverse(Node node) {

    if (node == null)

        return;

    System.out.print(node.data + " ");

    preOrderTraverse(node.left);

    preOrderTraverse(node.right);

}

// 中序遍历

public static void inOrderTraverse(Node node) {

    if (node == null)

        return;

    inOrderTraverse(node.left);

    System.out.print(node.data + " ");

    inOrderTraverse(node.right);

}

// 后序遍历

public static void postOrderTraverse(Node node) {

    if (node == null)

        return;

    postOrderTraverse(node.left);

    postOrderTraverse(node.right);

    System.out.print(node.data + " ");

}

二叉树遍历过程中，每个结点都被访问了一次，其时间复杂度是O(n)。接着，在找到位置后，执行增加和删除数据的操作时，我们只需要通过指针建立连接关系就可以了。对于没有任何特殊性质的二叉树而言，抛开遍历的时间复杂度以外，真正执行增加和删除操作的时间复杂度是O(1)。树数据的查找操作和链表一样，都需要遍历每一个数据去判断，所以时间复杂度是O(n)。
3.二叉查找树的特性
在二叉查找树中的任意一个结点，其左子树中的每个结点的值，都要小于这个结点
在二叉查找树中的任意一个结点，其右子树中每个结点的值，都要大于这个结点的值。
在二叉查找树中，会尽可能规避两个结点数值相等的情况。
3.1.二叉树的查找操作
在利用二叉树执行查找操作时，我们可以进行以下判断：
首先判断根结点是否等于要查找的数据，如果是就返回。
如果根节点大于要查找的数据，就在左子树中递归执行查找动作，直到叶子结点。
如果小于要查找的数据，就在右子树中递归执行查找动作，直到叶子结点。
这样的二分查找所消耗的时间复杂度就可以降低为O(logn)。
3.2.二叉查找树的插入操作
在二叉查找树执行插入操作也简单。从根节点开始，如果要插入的数据比根节点的数据大，且根节点的右子结点不为空，则在根节点的右子树中继续尝试执行插入操作。直到找到为空的子结点执行插入动作。
二叉查找树插入数据的时间复杂度是O(logn)。但这并不意味着它比普通的二叉树要复杂。原因在于这里的时间复杂度更多是消耗在了遍历数据去找到查找位置上，真正执行插入动作的时间复杂度仍然是O(1)。
二叉查找树的操作删除会比较复杂，这似乎因为删除完某个结点后的树，仍要满足二叉查找树的性质。我们分为下面三种情况讨论/
情况一，如果要删除的节点是某个叶子节点，则直接删除，将其父结点指针指向null即可。
情况二，如果要删除的结点只有一个子结点，只需要将其父结点指向的子节点的指针换成其子结点的指针即可。
情况三，如果要删除的结点有两个子结点，则有两种可行的操作方式
第一种：找到这个结点的左子树中最大的结点，替换要删除的结点
第二种，找到这个结点的右子树中最小的结点，替换要删除的结点。
4.例题
输入一个字符串，判断它在已有的字符串集合中是否出现过?（假设集合中没有某个字符串与另一个字符串拥有共同前缀且完全包含的特殊情况，例如 deep 和 dee。）
我们假设采用最暴力的办法，估算一下时间复杂度。假设字符串集合包含了 n 个字符串，其中的字符串平均长度为 m。那么新来的一个字符串，需要与每个字符串的每个字符进行匹配。则时间复杂度为 O(nm)。
但在 nm 的复杂度中，显然存在很多的无效匹配。例如，输入 home 时，6 个字符串都没有 h 开头的，则不需要进行后续的匹配。因此，如果可以通过对字符前缀进行处理，就可以最大限度地减少无谓的字符串比较，从而提高查询效率。这就是“用空间换时间”的思想，再利用共同前缀来提高查询效率。
其实，这个问题利用树结构也可以完成。我们对字符串建立一个的树结构，如下图所示，它将字符串集合的前缀进行合并，每个根结点到叶子结点的链条就是一个字符串。
这个树结构也称作 Trie 树，或字典树。它具有三个特点：
第一，根结点不包含字符；
第二，除根结点外每一个结点都只包含一个字符；
第三，从根结点到某一叶子结点，路径上经过的字符连接起来，即为集合中的某个字符串。
这个问题的解法可以拆解为以下两个步骤：
第一步，根据候选字符串集合，建立字典树。这需要使用数据插入的动作。
第二步，对于一个输入字符串，判断它能否在这个树结构中走到叶子结点。如果能，则出现过。
8.哈希表：如何利用好高效率查找的利器