数据结构和算法笔记（一）：二叉树、堆、链表、双指针

最新推荐文章于 2024-10-10 20:14:35 发布

XindaBlack

最新推荐文章于 2024-10-10 20:14:35 发布

阅读量359

点赞数

分类专栏：数据结构文章标签：数据结构算法

本文链接：https://blog.csdn.net/xindablack/article/details/105642883

版权

数据结构专栏收录该内容

6 篇文章 0 订阅

订阅专栏

时间复杂度

常见数据结构的查找、插入、删除时间复杂度

二叉树（Binary Tree）

存储结构

二叉树的存储结构有两种，顺序存储结构和链式存储结构。
PS：链式存储结构的二叉树极端情况下会退化成单链表。

基本概念

二叉树基本概念一览 -> 结点的度，结点的种类，遍历方式…
树的高度和深度的区别：某结点的深度是指从根结点到该结点的最长简单路径边的条数，而高度是指从该结点到叶子结点的最长简单路径边的条数。（这里规定根结点的深度和叶子结点的高度为0）因此，树的高度和深度是一样的，但是对于某个结点的高度和深度是不一定相等。

二叉树的深度 = max(左子树深度，右子数深度) + 1，可用递归的方式实现（“左右根”，后序遍历）。

二叉树分类

前提：树的高度h从1开始，根结点下标为1。

满二叉树(perfect binary tree)：每层结点个数都是最大值的二叉树。如果二叉树的结点个数为 $2^{h-1}$ 个，则可以判断为满二叉树。（遍历所有节点，计算节点个数，O(n)）

完全二叉树(complete binary tree)：在完全二叉树中，除了最底层结点可能没填满外，其余每层结点数都达到最大值，并且最下面一层的结点都集中在该层最左边的若干位置。若最底层为第 h 层，则该层包含 $1～2^{h-1}$ 个结点。
完全二叉树的节点个数 -> 利用完全二叉树的性质，即左右子树中必定有满二叉树，另一个子树为完全二叉树，可以递归进行。满二叉树的节点个数可以通过树的高度h直接计算得到。时间复杂度O((logn)^2)，每层递归需要计算一次左右子树的高度， $2\times(h-1+h-2+h-3+...+1)$ -> O(h^2)。
PS：已知是完全二叉树，判断是否为满二叉树，主要判断树最左边和最右边的结点高度是否相等，相等则是满二叉树。
判断是否为完全二叉树：bfs找到第一个不含有孩子或者只含有一个左孩子的结点，那么后续的结点必须是叶子结点才满足完全二叉树性质。

    int countNodes(TreeNode* root) {
        int h;
        if(isFullTree(root, h)){
            return (1<<h) -1;
        }
        return countNodes(root->left)+countNodes(root->right)+1; // ‘+1’是把root自身也算上
    }

    // 判断完全二叉树是否为满二叉树
    bool isFullTree(TreeNode* root, int& h){
        if(root==nullptr){
            h = 0;
            return true;
        }
        TreeNode* p = root;
        int countLeft = 1, countRight = 1;
        while(p->left!=nullptr){
            p = p->left;
            countLeft++;
        }
        p = root;
        while(p->right!=nullptr){
            p = p->right;
            countRight++;
        }
        h = countLeft;
        return countLeft == countRight;
    }

二叉搜索树/二叉排序树（binary search tree）：它或者是一棵空树，或者是具有下列性质的二叉树：若它的左子树不空，则左子树上所有结点的值均小于它的根结点的值；若它的右子树不空，则右子树上所有结点的值均大于等于它的根结点的值；它的左、右子树也分别为二叉排序树。查找平均效率O(logn)。
二叉搜索树的第k大节点 -> 利用二叉搜索树性质，中序遍历二叉搜索树输出的按非严格递增或者递减序排列的值。（递增是左根右，递减是右左根）

int count;
// 反向的中序遍历，"右根左",结点的值按降序输出
int kthLargest(TreeNode* root, int k) {
    int re;
    count = k;
    traverse(root,&re);
    return re;
}

void traverse(TreeNode* root, int* re){
    if(root==nullptr){
        return;
    }
    traverse(root->right,re);
    if(count==1){
        *re = root->val;
    }
    if(--count == 0){ // 剪枝
        return;
    }
    traverse(root->left,re);
}

二叉搜索树的最近公共祖先 -> 利用BST的右孩子>=根>左孩子的性质即可。

    TreeNode* lowestCommonAncestor(TreeNode* root, TreeNode* p, TreeNode* q) {
        if(root==nullptr || p->val < root->val && q->val >= root->val || 
        (p->val >= root->val && q->val < root->val)|| 
        root->val == p->val || root->val == q->val){
            return root;
        }
        TreeNode* l = lowestCommonAncestor(root->left,p,q);
        TreeNode* r = lowestCommonAncestor(root->right,p,q);
        return l==nullptr ? r:l;
    }

PS：二叉树的最近公共祖先 -> 后序遍历，左右孩子其中一个返回p或q指针，则将p或q指针向上传递；若左右孩子分别返回有p和q指针，则根为LCA。（如果是p或q结点是它自己的祖先的情况，最终返回p或者q指针！）

	// 后序遍历
    TreeNode* lowestCommonAncestor(TreeNode* root, TreeNode* p, TreeNode* q) {
        if(root == nullptr || root == p || root == q){ // 遇到p和q指针或者空指针返回
            return root;
        }
        TreeNode* left, *right;
        left = lowestCommonAncestor(root->left,p,q);
        right = lowestCommonAncestor(root->right,p,q);
        if(left == p && right == q || (left == q && right == p)){ // root为LCA，并将root指针本身向上传递
            return root;
        }
        // left和right为空指针表示以它们为根的子树没有p和q结点，因此返回它们之中的非空指针，传递给root
        return left==nullptr? right:left; 
    }

二叉搜索树的查找效率取决于树的高度，因此保持树的高度最小，即可保证树的查找效率。AVL树和红黑树都是自平衡的二叉搜索树。
平衡二叉树/AVL树：在AVL树中，任一节点对应的左、右子树的最大高度差为1，因此它也被称为高度平衡树。查找、插入和删除在平均和最坏情况下的时间复杂度都是 $O(\log {n})$ ，但平衡树结构的代价较大。什么是平衡二叉树（AVL）
判断是否为平衡二叉树 -> 判断树中所有结点的子树的高度差是否都不大于1。

    bool isBalanced(TreeNode* root) {
        bool flag = true; // 平衡二叉树可以是空树
        traverse(root,&flag);
        return flag;
    }
    // 从底向上求结点的高度
    int traverse(TreeNode* root, bool* flag){
        if(root==nullptr || !flag){ // 当已经判断不是平衡二叉树的时候可以直接剪枝返回了
            return 0;
        }
        
        int l = traverse(root->left,flag);
        int r = traverse(root->right,flag);
        if(abs(l-r) > 1){
            *flag = false;
        }
        return max(l,r)+1;
    }

红黑树/RBT树：从根节点到叶子节点的最长路径不超过最短路径的两倍。查找效率基本维持在O(logn)，但在最差情况下比AVL树要逊色一点，远远好于BST树。
漫画：什么是红黑树？
轻松搞定面试中的红黑树问题
PS：大量数据实践证明，RBT的总体统计性能要好于平衡二叉树。

STL里哪些容器用到二叉树存储？

map、set的底层数据结构是红黑树，插入的数据是有序存储的，默认按key的升序存储，查找效率O(logn)。map和set是关联容器，内部所有元素都是以结点的方式来存储，为链式存储结构。（unordered_map和unorder_set的底层数据结构是哈希表，查找效率O(1)，但插入数据是无序的，为顺序存储结构）

堆（heap）

堆以完全二叉树的形式表示，用队列（数组）存储，队列中允许的操作是先进先出（FIFO），在队尾插入元素，在队头取出元素。堆也是一样，在堆底插入元素，在堆顶取出元素，但是堆中元素的排列不是按照到来的先后顺序，而是按照一定的优先顺序排列的，因此也称为优先队列（priority queue）。(若队列中根结点下标为 $i$ 且 $i$ 从1开始，则它的左孩子下标为 $2 i$ ，右孩子下标为 $2 i + 1$ )

堆分为大顶堆和小顶堆。堆顶为队列的头部，在堆顶取出元素，一般为最大或者最小的元素；堆底为队列的尾部，在堆底插入元素。大顶堆要求根结点的值大于等于左右孩子节点的值，小顶堆要求根结点的值小于等于左右孩子节点。

建堆

自底向上建堆：从下标最大的非叶子结点开始，从右向左，从底至上调整堆，每次调整为一次下沉操作。调整下标为 $i$ 的结点的子树最多需要交换 $h-\lfloor log_2i \rfloor-1$ 次， $h$ 为树的高度， $\lfloor log_2i \rfloor+1$ 为结点 $i$ 所处二叉树中的层数（层数从1开始），可推得建堆的时间复杂度O(n)。为什么建立一个二叉堆的时间为O(N)而不是O(Nlog(N))?