数据结构笔记整理第5章：树和二叉树

最新推荐文章于 2023-05-19 17:45:50 发布

SYSU_BY

最新推荐文章于 2023-05-19 17:45:50 发布

阅读量4.7k

点赞数 3

分类专栏：数据结构文章标签：数据结构二叉树考研树

本文链接：https://blog.csdn.net/lby0910/article/details/51475396

版权

数据结构专栏收录该内容

9 篇文章 2 订阅

订阅专栏

第5章树和二叉树

本章内容

本章主要介绍树、二叉树的概念，遍历方法以及应用等，本章在考研中是重点内容。

5.1 树相关的基本概念

树是一种非线性的数据结构，是若干结点的集合，有唯一的根结点和若干棵互不相交的子树构成。其中每一棵子树又是一棵树，也是由唯一的根结点和若干棵互不相交的子树组成的，由此可知：树的定义是递归的。树的结点数目可以为0，为0的时候是一棵空树。

结点：结点不仅包含数据元素，而且包含指向子树的分支。
结点的度：结点拥有子树的个数或者分支的个数。
树的度：树中各结点度的最大值。
叶子结点：终端结点，度为0的结点。
非终端结点：分支结点，内部结点，度不为0的结点。
以根结点为第一层，以此类推。
树的高度（深度）：树中结点的最大层次。
结点的深度：从根结点开始计算，根结点深度为1。
结点的高度：从底层叶子结点开始计算，叶子结点高度为1。
有序树：树中结点子树从左到右有序，不能交换。
丰满树：出最底层外，其他层都是满的。
森林：若干棵互不相交的树的集合。

5.2 树的存储结构

双亲存储结构：一种顺序存储结构，知道了i，tree[i]为其双亲结点。
孩子存储结构：同图中的邻接表存储。

5.3 二叉树的相关的基本概念

一般的树加上如下的两个限制条件，就得到了二叉树：每个结点最多只有两棵子树，即二叉树中结点的度只能为0，1以及2；子树有左右之分，不能颠倒。
满二叉树：所有的分支结点都有左孩子和右孩子结点，并且叶子结点都集中在二叉树的最下层，这样的二叉树称为满二叉树。对满二叉树编号：编号从1开始，从上到下、从左到右进行。
完全二叉树：一棵深度为K有n个结点的二叉树进行编号后，各结点的编号与深度为K的满二叉树上相同位置的结点的编号相同。一棵完全二叉树一定是由一棵满二叉树从右至左、从下至上挨个删除结点所得到的。

5.4 二叉树的主要性质

1.非空二叉树上叶子结点数等于双分支结点数加1，即总分支数 = 总结点数 - 1
2.二叉树的第i层上最多有(i >= 1)个结点
3.高度（或深度）为K的二叉树最多有个结点，换句话说：满二叉树中前K层结点个数为：
4.有n个结点的完全二叉树，对各结点从上到下，从左到右依次编号（范围1~n），则结点之间的关系，若i为某结点编号，则：
若i≠1，双亲编号⌊i/2⌋；
若2i≤n，左孩子为2i，若2i>n，无左孩子；
若2i+1≤n，右孩子为2i+1，若2i+1>n，无右孩子；
5.n个结点，构成h(n)种不同的二叉树，则：

6.n个结点的完全二叉树高度（深度）为：

5.5 二叉树的存储结构

顺序存储：最适合于完全二叉树，使用顺序存储结构要从数组下标为1开始。这里要注意区分树的顺序存储结构和二叉树的顺序存储结构：
树：数组下标代表结点的编号，内容表示结点之间的关系；
二叉树：数组下标既指示了编号又指示了关系。
链式存储：

typedef struct BTNode {
    char data;
    struct BTNode *lchild;
    struct BTnode *rchild;
}BTNode;

5.6 树、森林与二叉树的转换

将树转换为二叉树：同一结点的各孩子结点用线串起来，将每个结点的分支从左往右除了第一个以外，其余全部剪掉，擦掉虚线，连成实线，得到二叉树。
【例子1】树转换为二叉树

将森林转换为二叉树：根据孩子兄弟的法则，根结点没有右兄弟，所以转换为二叉树没有右孩子。将森林中第二棵树转换成的二叉树，当作第一棵树的右子树，依此类推。
【例子2】森林转换为二叉树

5.7 二叉树的遍历算法

包括：先序遍历、中序遍历、后序遍历和层次遍历。
先序遍历：
如果二叉树为空数，什么都不做。
否则，访问根节点->先序遍历左子树->先序遍历右子树

/* pre order by recursion method */
void preOrder(BTNode *p) {
    if (p != null) {
        visit(p->data);
        preOrder(p->lchild);
        preOrder(p->rchild);
    }
}

/* pre order by no recursion method */
void preOrder(BTNode *p) {
    Stack <BTNode *> s;
    BTNode *q;
    q = p;
    s.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            visit(q->data);
            s.push(q);
            q = q->lchild;  
        }
        else {
            s.pop(q);
            q = q->rchild;
        }
    } 
}

中序遍历：
如果二叉树为空数，什么都不做。
否则，中序遍历左子树->访问根结点->中序遍历右子树

/* in order by recursion method */
void inOrder(BTNode *p) {
    if (p != null) {
        inorder(p->lchild);
        visit(p->data);
        inorder(p->rchild);
    }
}

/* in order by no recursion method */
void inOrder(BTNode *p) {
    Stack <BTNode *> s;
    BTNode *q = p;
    s.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            s.push(q);
            q = q->lchild;
        }
        else {
            s.pop(q);
            visit(q->data);
            q = q->rchild;
        }
    }
}

后序遍历：
如果二叉树为空数，什么都不做。
否则，后序遍历左子树->后序遍历右子树->访问根结点

/* post order by recursion method */
void postOrder(BTNode *p) {
    if (p != null) {
        postOrder(p->lchild);
        postOrder(p->rchild);
        visit(p->data);
    }
}

/* post order by no recursion method */
void postOrder(BTNode *p) {
    Stack <BTNode *> s;
    Stack <int> tag;
    BTNode *q = p;
    int f;
    s.initial();
    tag.initial();
    while(q != null || !s.empty()) {
        if (q != null) {
            s.push(q);
            q = q->lchild;
            tag.push(1);
        }
        else {
            s.pop(q);
            tag.pop(f);
            if (f == 1) {
                s.push(q);
                tag.push(2);
                q = q->rchild;
            }
            else {
                visit(q->data);
                q = null;
            }
        }
    }
}

层次遍历：
按照一定的方向（如从左至右，从上至下）每一层次对二叉树各个结点进行访问。要进行层次遍历，需要建立一个循环队列，先将二叉树头结点入队列，然后出队列，访问该结点，如果有左子树，则左子树根结点入队；如果有右子树，则右子树根结点入队。出队列，访问出队列结点，如此反复直到队列空为止。

void levelOrder(BTNode *p) {
    Queue <BTNode *> q;
    BTNode *r;
    q.initial();
    if (p != null) {
        q.push(p);
        while(!q.empty()) {
            q.pop(r);
            visit(r->data);
            if (r->lchild != null) {
                q.push(r->lchild);
            }
            if (r->rchild != null) {
                q.push(r->rchild);
            }
        }
    }
}

【例子3】二叉树的遍历结果

先序遍历：A->B->C->D->E->F->G->H
中序遍历：C->B->E->D->F->A->H->G
后序遍历：C->E->F->D->B->H->G->A
层次遍历：A->B->G->C->D->H->E->F

5.8 树和森林的遍历算法

树的遍历：
先根遍历：先访问根结点、再访问子树。
后根遍历：先访问子树，再访问根结点。
树的先根遍历对应二叉树的先序遍历。
树的后根遍历对应二叉树的中序遍历。
森林的遍历：
先序遍历：对应二叉树的先序遍历，先访问第一棵树的根结点，先序遍历第一棵树中根结点的子树，先序遍历森林中除去第一棵树的其他树。
中序遍历：对应二叉树的中序遍历，中序遍历第一棵树根结点的子树，访问第一棵树的根结点，中序遍历森林中除去第一棵树的其他树。

5.9 线索二叉树

ltag=0：lchild为指针，指向结点左孩子；ltag=1，表示lchild为线索，指向结点直接前驱。
rtag=0：rchild为指针，指向结点右孩子；rtag=1，表示rchild为线索，指向结点直接后驱。

typedef struct TBTNode {
    char data;
    int ltag, rtag;
    struct TBTNode *lchild;
    struct TBTNode *rchild;
} TBTNode;

5.10 二叉排序树（BST）

这部分内容主要应用在“查找或者排序部分”。二叉排序树或者是空树，或者是满足以下性质的二叉树：
若左子树不空，则左子树所有值 < 根
若右子树不空，则右子树所有值 > 根
左右子树各是一棵二叉排序树
输出二叉排序树的中序遍历，则该输出序列为递增序列。

typedef struct BTNode {
    int key;
    struct BTNode *lchild;
    struct BTNode *rchild;
} BTNode;

5.11 平衡二叉树（AVL）

这部分内容主要应用在“查找或者排序部分”。
左右子树都是平衡二叉树，并且左右子树的高度之差的绝对值不超过1（引入了平衡因子的概念）。
一个结点的平衡因子：左子树高度 - 右子树高度。取值：-1，0，1
当失去平衡的最小子树被调整为平衡子树之后，无需调整原有其他所有不平衡子树，整个二叉排序树会成为一棵平衡二叉树。
最小子树：以距离插入结点最近，且平衡因子绝对值大于1的结点作为根的子树。

将失去平衡的二叉树进行平衡调整有4种情况：LL型、RR型、LR型和RL型。
LL型：在左子树根结点的右子树上插入结点 -> 右旋
LR型：在左子树根结点的右子树上插入结点 -> 左旋 + 右旋
RR型：在右子树根结点的右子树上插入结点 -> 左旋
RL型：在右子树根结点的左子树上插入结点 -> 右旋 + 左旋

【例子4】平衡二叉树的插入删除和平衡调整
以关键字{16、3、7、11、9、26、18、14、15}构造一棵AVL树，构造完成后依次删除16、15、11

插入部分：

删除部分：

5.12 B-树与B+树

B-树可以看作是二叉排序树的扩展，二叉排序树是二路查找，B-树的多路查找。因为B-树结点内的关键字是有序的，在结点内查找的时候除了顺序查找外，可以用折半查找。B-树需要满足以下条件：
每个结点最多有m个分支（子树）；而最少分支棵树要看是否为根结点，根结点最少两个分支，非根结点最少有个分支；
有n个分支的结点有n-1个关键字，从左至右递增顺序排列；
各个底层是叶结点，叶结点下面是失败结点（空指针表示）。

B+树是B-树的一种变形。它们之间的差别主要有：
B+树中，n个关键字的结点含有n个分支，B-树中有n+1个分支；
B+树中叶子结点包含信息，并且包含了全部关键字，B-树的叶子只包含关键字（索引）
由于这里并不是考研重点考察的部分，所以关于B+树和B-树的详细操作会在后面的文章中单独描述。

5.13 哈夫曼树和哈夫曼编码

哈夫曼树是最优二叉树，带权路径最短。
路径：树中一个结点到另一个结点分支构成的路线。
路径长度：路径上的分支数目。
树的路径长度：从根到每个结点的路径长度之和。
带权路径长度：结点有权值，结点到根之间的路径长度乘以结点的权值。
**树的带权路径长度：**WPL，树中所有叶子结点带权路径长度之和。

哈夫曼树的特点：权值越大的结点，距离根结点越近。树中没有度为1的结点的哈夫曼树称为严格（正则）二叉树。

哈夫曼树的构造方法：
给定n个权值
（1）将n个权值看作只有根的n棵二叉树，集合记为F。
（2）F中挑选两棵根结点权值最小的（a, b）作为左右子树，构成新树c。
（3）F中删除a与b，加入c。

【例子5】哈夫曼树的构建