数据结构09--数与二叉树超详解

树与二叉树

一 树的基本概念

        树是一种非线性结构,其严格的数学定义是:如果一组数据中除了第一个节点(第一个节点称为根节点,没有直接前驱节点)之外,其余任意节点有且仅有一个直接前驱,有零个或多个直接后继,这样的一组数据形成一棵树。这种特性简称为一对多的逻辑关系。

常见例子

        日常生活中,很多数据的组织形式本质上是一棵树。比如一个公司中的职员层级关系,一个学校中的院系层级关系,淘汰赛中的各次比赛队伍,一个家族中的族谱成员关系等,这些都是树状逻辑结构。由于树状结构表现出来都是具有层次的,因此也被称为层次结构。

通常,在逻辑上表达一棵抽象的树状结构的时候,习惯于将树根放在顶部,树枝树杈向下生长,如下图所示。

  • 对于一棵树来说,有如下基本术语:
  • 根(root):

树的第一个节点,没有直接前驱。如上图中的A。

  • 双亲节点(parent):

某节点的直接前驱称为该节点的双亲节点,或成为父节点。例如上图中A是B的父节点。

  • 孩子节点(child): 

某节点的直接后继称为该节点的孩子节点。例如上图中B、C、D均为A的孩子节点。

  • 节点的层次(level):

根节点所在的层次规定为第1层,其孩子所在的层次为第2层,后代节点以此类推。比如上图中节点E的层次是3。

  • 节点的度(degree):

一个节点拥有的孩子节点的总数,称为该节点的度。比如上图中节点B的度为2。

  • 叶子(leaf):

一棵树中度等于0的节点,被称为叶子,又称为终端节点。比如上图中K、L、F、G、M、I、J均为叶子。

  • 树的高度(height):

一棵树中所有节点的层次的最大值,称为这棵树的高度,又称为树的深度。比如上图的树的高度为4。

  • 有序树与无序树:

一棵树中,如果某个节点的孩子节点之间是有次序的,则称这棵树为有序树,反之称为无序树。

有序树的定义:若将树中每个节点的各子树看成是从左到右有次序的(即不能互换),则称该树为有序树(Ordered Tree)

无序树的定义:若将树中每个结点的各子树从左到右是没有次序的(即可以互换),则称该树为无序树

二、二叉树

在各种不同的树状结构中,最常见也最重要的是二叉树(Binary Tree),下面是二叉树的定义:

  • 有序树
  • 任意节点的度小于等于2(一个节点最多两个孩子)

比如如下这棵树就是一棵二叉树。其中8是根节点,14是10的右孩子(因为二叉树是有序树,因此严格区分左右),而13则是14的左孩子。

为了方便对二叉树进行操作,通常会对一棵它进行标号:从上到下,从左到右进行标号:

注意:

没有孩子节点的地方也要标出来

对于二叉树而言,有如下特性:

  1. 第i层上,最多有个2^(i-1)节点。
  2. 高度为k的二叉树,最多有2^k-1个节点。
  3. 假设叶子数目为n0​,度为2的节点数目为n2​,则有:n0​=n2​+1

另外,还需掌握如下重要的基本概念:

  • 满二叉树/完美二叉树:(full/perfect binary tree)

树的高度为k,且树的节点总数达到2^k−1的二叉树。

  • 完全二叉树:(complete binary tree)

各节点的标号连续(上到下,从左到右进行编号)。

  • 平衡二叉树:(balance binary tree)

任意节点的两棵子树高度差小于等于1。

  • 退化二叉树:(degenerate binary tree)

所有的节点的度小于等于1,此时的二叉树实际上已经退化成链表。

有如下二叉树,请指出哪些是满二叉树?完全二叉树?平衡二叉树和退化二叉树?

以上图从左到右依次是:

平衡二叉树  完全二叉树/平衡二叉树  退化二叉树  完美二叉树/完全二叉树/平衡二叉树  平衡二叉树

存储形式

与其他逻辑结构类似,可以使用顺序存储,也可以使用链式存储。

  • 顺序存储

由于在顺序存储,数据元素之间的逻辑关系是用物理位置来表达的,而二叉树中每一个节点都有一个对应的标号,因此可以使用标号来作为数组的下标,但除非是完美或者完全二叉树,否则会浪费存储空间,如下图所所示。

在顺序存储中,节点彼此之间的关系,要用到二叉树标号的基本特性。简单观察二叉树的标号会发现如下规律:

  1. 根节点标号为1,根节点没有父节点
  2. 标号为n的节点,其父节点的标号为n/2
  3. 标号为n的节点,其左孩子(若有)的标号为2n,其右孩子(若有)的标号为2n+1

根据以上结论,在顺序存储的二叉树中,虽然没有任何信息连接节点e和f,但根据他们的下标序号,可以得知e是f的父节点,且f是e的左孩子。

  • 链式存储

链式存储思路与链表类似,使用指针来直接将节点的逻辑关系串起来,比如:

对于链式存储而言,二叉树节点的设计与链表无异,如下:

typedef struct node
{
    datatype data; // 用户数据  数据域

    struct node *lchild; // 左孩子树指针
    struct node *rchild; // 右孩子树指针
}node;

 树的遍历(重点)

所谓遍历,就是按某种规律访问每一个节点。对于之前的线性表而言,遍历算法很简单,就是从头跑到尾,因为线性表是一对一的关系。但是树状结构是非线性的,因此从根节点开始遍历所有节点可以有多种不同的算法,常见的有:

  • 前序遍历(根左右):根节点 - 左子树 - 右子树
  • 中序遍历(左根右):左子树 - 根节点 - 右子树
  • 后序遍历(左右根):左子树 - 右子树 - 根节点
  • 按层遍历:从上到下,从左到右依次访问节点

其中需要注意的是,前中后序遍历,都是递归算法。以前序遍历为例,当访问完根节点,进而要访问左子树时,由于左子树本身一棵二叉树,因此也需要进行前序遍历,也是先访问左子树的根节点,然后再依次访问左子树的左子树和左子树的右子树。比如:

前序遍历的序列是:F - [BADCE] - [GIH]

其中,F是根节点,而BADCE是左子树,GIH是右子树。

对左子树的访问,也符合前序遍历的定义,即:B - [A] - [DCE]

以此类推,对上述二叉树而言:

中序遍历的序列是:[ABCDE] - F - [GHI]

后序遍历的序列是:[ACEDB] - [HIG] - F

至于按层遍历,就按照字面意思理解即可,序列是:FBGADICEH

三、二叉树代码:

1.BST的基本概念

二叉树的其中一个重要应用,是提供一种快速查找数据的方法,即:将数据节点按照某种规律形成一棵二叉树,然后利用二叉树特殊的逻辑结构减少搜索数据的次数,提高查找的效率。

这种按照某种规律构建,用来提高搜索性能的二叉树,被称为搜索二叉树(Binary Search Tree),即BST。

具体而言,二叉树提高搜索效率的秘诀在于:按照“小-中-大”(当然“大-中-小”也是一样的)的规律来存储数据,即对于任意一个节点,都可以明确找到其值大于或等于其左孩子节点,且小于或等于其右孩子节点。如下图所示:

由于树中所有的节点均满足“小-中-大”的规律,因此当从根开始查找某个节点时速度比顺序查找要快得多,比如要找节点38,当发现38大于根节点13后,就可以确定13的左子树一定没有38,这就去掉了半边子树的节点。

因此,二叉搜索树又被称为二叉排序树、二叉查找树。

实际上,对于一棵二叉树而言,其搜索节点的时间复杂度,最糟糕的情形是其退化为链表,最乐观的情形是完美或完全二叉树,那么其搜索时间复杂度就是介于:

最差:T(n)=O(n)

最优:T(n)=O(log2​n)

2.插入节点

对于BST而言,插入一个节点主要是要保持其“小-中-大”的逻辑不变,因此插入的节点的逻辑可以从根节点开始,一步步寻找新节点的“最终归宿”,比如在如下BST中,要插入新节点16,最终应该插入到节点17的左孩子处。

在实现插入算法的时候,由于树状结构本身是递归的,因此可以使用递归函数更优雅地实现插入算法。如下:

// 假设 BST 节点存储的数据类型是 int
node *newNode(int data)
{
    // 准备好新节点,并将数据填入其中
    node *new = (node *)malloc(sizeof(node));
    if(new != NULL)
    {
        new->data = data;
        new->lchild = NULL;
        new->rchild = NULL;
    }
    return new;
}

// 将新节点new插入到一棵以 root 为根的 BST 中
// 插入节点后,返回新的 BST 的根
node *bstInsert(node *root, node *new)
{
    // 若此时 BST 为空,则返回 new 使之成为二叉树的根节点
    if(root == NULL)
        return new;

    // 若新节点比根节点小,那么新节点应该插入左子树中
    // 至于插入到左子树的具体什么位置就不用管了,直接递归即可
    if(new->data < root->data)
        root->lchild = bstInsert(root->lchild, new);

    // 若新节点比根节点大,那么新节点应该插入右子树中
    // 至于插入到右子树的具体什么位置就不用管了,直接递归即可
    else if(new->data > root->data)
        root->rchild = bstInsert(root->rchild, new);

    // 若已存在,则不处理  数据不允许相同
    else
    {
        printf("%d已存在\n", new->data);
        free(new);
    }
    //更新根节点
    return root;
}

根据上述BST的插入算法,依次输入如下数据:8、3、1、6、4、7、10、14、13

创建如下二叉树:

提示:

为了检验创建出来的二叉树是否正确,可以使用如下代码将二叉树以网页形式展现出来:

#define TREENODE node // 声明自定义的二叉树节点为TREENODE
#include "drawtree.h" // 包含画树代码

int main()
{
    ...

    // 以网页形式展现二叉树
    draw(root);
}

其中,node是自己定义的二叉树的节点的类型,在包含 drawtree.h 之前定义 TREENODE 这个宏为 node ,即可展示对应二叉树。

drwatree.h画二叉树头文件可点击资源下载。

删除节点

删除一个BST的节点要比插入困难一点,但同样是要遵循一个原则,即:删除节点后仍然要保持“小-中-大”的逻辑关系。

假设要删除的节点是x,大体思路如下:

  1. 若要删除的节点小于根节点,则递归地在左子树中删除x
  2. 若要删除的节点大于根节点,则递归地在右子树中删除x
  3. 若要删除的节点恰好就是根节点,则分如下几种情况:

a. 根节点若有左子树,则用左子树中最大的节点max替换根节点,并在左子树中递归删除max

b. 否则,若有右子树,则用右子树中最小的节点min替换根节点,并在右子树中递归删除min

c. 否则,直接删除根节点

以下图为例,假设在一棵二叉树中要删除节点15,在找到节点之后,判断其有左子树,那么就沿着其左子树找到最右下角(最大)的节点11,替换要删除的节点15,然后再将多余的节点11删掉:

删除一个有左子树的节点过程

而如果要删除的节点没有左子树,只有右子树,那么情况是完全对称的,如下图所示,假设要删除节点25,由于25没有左子树,因此找到其右子树中最左下角(最小)的节点16,替换要删除的节点25,然后再将多余的节点16删掉:

删除一个只有右子树的节点过程

代码如下:

// 将数据(以整型为例)data从二叉树中删除
// 并返回删除之后的二叉树的根
node *bstRemove(node *root, int data)
{
    node *tmp = NULL;
    
    if(root == NULL)
        return NULL;

    // 若data小于根节点,则递归地在左子树中删除它
    if(data < root->data)
        root->lchild = bstRemove(root->lchild, data);

    // 若data小于根节点,则递归地在左子树中删除它
    else if(data > root->data)
        root->rchild = bstRemove(root->rchild, data);

    //找到相同的数据 
    else
    {
        // a. 根节点若有左子树,则用左子树中最大的节点max替换根节点
        //    并在左子树中递归删除max  
        if(root->lchild != NULL)
        {
            node *max;
            for(max=root->lchild; max->rchild!=NULL;
                max=max->rchild);

            root->data = max->data;
            root->lchild = bstRemove(root->lchild, max->data);
        }

        // b. 否则,若有右子树,则用右子树中最小的节点min替换根节点
        //    并在右子树中递归删除min  
        else if(root->rchild != NULL)
        {
            for(tmp=root->rchild; tmp->lchild!=NULL;
                tmp=tmp->lchild);

            root->data = tmp->data;
            root->rchild = bst_remove(root->rchild, tmp->data);
        }

        // c. 否则,直接删除节点
        else
        {
            free(root);
            return NULL;
        }
    }

    return root;
}

遍历代码

以上述练习中的二叉树为例,采用前、中、后序遍历的算法示例代码如下:

// 前序遍历
void preOrder(node *root)
{
    if(root == NULL)
        return;

    // 先访问根节点
    printf("%d", root->data);

    // 再依次使用前序算法,遍历其左、右子树
    preOrder(root->lchild);
    preOrder(root->rchild);
}

// 中序遍历
void inOrder(node *root)
{
    if(root == NULL)
        return;

    // 先访问左子树
    inOrder(root->lchild);

    // 再访问根节点
    printf("%d", root->data);

    // 再访问右子树
    inOrder(root->rchild);
}

// 后序遍历
void postOrder(node *root)
{
    if(root == NULL)
        return;

    // 先依次使用后序算法,遍历其左、右子树
    postOrder(root->lchild);
    postOrder(root->rchild);

    // 再访问根节点
    printf("%d", root->data);
}

对于按层遍历,则需要借助队列来达到这一目的。具体做法是:

  1. 创建一个队列,并将根节点指针入队
  2. 判断队列是否为空:

a. 是则退出程序

b. 否则让队头元素出队,并将队头的左右孩子依次入队

c. 循环步骤2

以下是示例代码:

void levelOrder(node *root)
{
    if(root == NULL)
        return;

    // 将根节点入队
    linkQueue *q = initQueue();
    enQueue(q, root);

    node *tmp;
    while(!isEmpty(q))
    {
        // 出队并访问队头
        outQueue(q, &tmp);
        printf("%d\t", tmp->data);

        // 依次将其左右孩子(若有)入队
        if(tmp->lchild != NULL)
            enQueue(q, tmp->lchild);

        if(tmp->rchild != NULL)
            enQueue(q, tmp->rchild);
    }
    printf("\n");
}

三、结语

         在本文中,我们深入探讨了数据结构中的树,特别是二叉树的基本概念与应用。二叉树作为一种重要的数据结构,不仅在算法设计中扮演着关键角色,还在实际应用中带来了高效的数据存储与检索方式。希望通过本文的讲解,能够帮助读者更好地理解二叉树的构建、遍历方法以及在解决问题时的实用性。

        掌握二叉树及其变种,如平衡二叉树和红黑树,将为我们的编程能力和算法思维打下坚实的基础。期待大家在实际编程中灵活运用所学知识,感谢您阅读本篇博客,也欢迎您分享自己的想法和经验,让我们共同成长!如果您有任何问题或建议,欢迎在评论区留言。

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值