数据结构二叉树详解

hrimkn

已于 2022-09-19 10:07:14 修改

阅读量254

点赞数 2

文章标签：数据结构算法

于 2022-09-15 23:45:29 首次发布

本文链接：https://blog.csdn.net/weixin_69519040/article/details/126840586

版权

前言：

本篇文章将系统地分享我在学习二叉树中的心得，我会先简述一下树的概念及结构，然后引出二叉树的相关概念，理解了树的概念之后，会分别用顺序结构和链式结构来实现二叉树。其中二叉树的实现中，顺序结构的堆，以及链式结构可以说是非常令人头大。因此这两部分内容也是我本篇文章的分享重点，之后也会分享一些解决二叉树oj题的解题思路。目录中前两部分自我感觉较为繁琐可以跳过，但是堆和链式结构请一定认真看完。

同样作为数据结果的萌新，自认为我的语言更加贴近初学者，请点进来的各位新手一定耐心看完，相信我的分享一定能给你带来一些启发。同时文章中出现的错误也希望各位大佬指出，谢谢大家！！！

1. 树的概念及结构

1.1 树的概念

树是一种非线性的数据结构，它是由n（n>=0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

有一个特殊的结点，称为根结点，根节点没有前驱结点
除根节点外，其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm，其中每一个集合Ti(1<= i<= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有0个或多个后继
因此，树是递归定义的。

注意：树形结构中，子树之间不能有交集，否则就不是树形结构

1.2 树的相关概念

节点的度：一个节点含有的子树的个数称为该节点的度；如上图：A的为6
叶节点或终端节点：度为0的节点称为叶节点；如上图：B、C、H、I...等节点为叶节点
非终端节点或分支节点：度不为0的节点；如上图：D、E、F、G...等节点为分支节点
双亲节点或父节点：若一个节点含有子节点，则这个节点称为其子节点的父节点；如上图：A是B的父节点
孩子节点或子节点：一个节点含有的子树的根节点称为该节点的子节点；如上图：B是A的孩子节点
兄弟节点：具有相同父节点的节点互称为兄弟节点；如上图：B、C是兄弟节点
树的度：一棵树中，最大的节点的度称为树的度；如上图：树的度为6
节点的层次：从根开始定义起，根为第1层，根的子节点为第2层，以此类推；
树的高度或深度：树中节点的最大层次；如上图：树的高度为4
堂兄弟节点：双亲在同一层的节点互为堂兄弟；如上图：H、I互为兄弟节点
节点的祖先：从根到该节点所经分支上的所有节点；如上图：A是所有节点的祖先
子孙：以某节点为根的子树中任一节点都称为该节点的子孙。如上图：所有节点都是A的子孙
森林：由m（m>0）棵互不相交的树的集合称为森林

注意红色为常用的概念。

1.3 树的表示

树结构相对线性表就比较复杂了，要存储表示起来就比较麻烦了，既然保存值域，也要保存结点和结点之间的关系，实际中树有很多种表示方式如：双亲表示法，孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。

typedef int DataType;
struct Node
{
    struct Node* _firstChild1;  // 第一个孩子结点
    struct Node* _pNextBrother; // 指向其下一个兄弟结点
    DataType _data;             // 结点中的数据域
};

1.4 树在实际中的应用

树结构在实际中应用还是挺广的。比如有目录树，菜单树，权限树，商品分类列表等等。

2. 二叉树的概念及结构

了解完树的概念之后，进入今天的重点二叉树

废话不说直接进入主题什么是二叉树？

2.1 概念

一棵二叉树是结点的一个有限集合，该集合:

1. 或者为空
2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成

通俗来讲，二叉树就是度最大为2的树。

从上图我们也可以看出：

二叉树不存在度大于2的结点
二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树

2.2 特殊的二叉树

满二叉树：一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个二叉树的层数为K，且结点总数是，则它就是满二叉树。
完全二叉树：完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为K的，有n个结点的二叉树，当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

2.3 二叉树的性质

2.4 二叉树的存储结构

二叉树一般可以使用两种结构存储，一种顺序结构，一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储，一般使用数组只适合表示完全二叉树，因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储，关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组，在逻辑上是一颗二叉树。

2.链式存储

二叉树的链式存储结构是指，用链表来表示一棵二叉树，即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成，数据域和左右指针域，左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链，今天我分享的都是二叉链。

typedef int BTDataType;
// 二叉链
struct BinaryTreeNode
{ 
    struct BinTreeNode* pLeft;  // 指向当前节点左孩子
    struct BinTreeNode* pRight; // 指向当前节点右孩子
    BTDataType data;            // 当前节点值域
}

3. 二叉树的顺序结构及实现

3.1 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的，因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储，需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

3.2 堆的概念及结构

堆的性质：

堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树

3.3 堆的实现

3.3.1 堆向下调整算法

现在我们给出一个数组，逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提：左右子树必须是一个堆，才能调整。

int array[] = {27,15,19,18,28,34,65,49,25,37}

3.3.2 堆的创建

下面我们给出一个数组，这个数组逻辑上可以看做一颗完全二叉树，但是还不是一个堆，现在我们通过算法，把它构建成一个堆。根节点左右子树不是堆，我们怎么调整呢？这里我们从倒数的第一个非叶子节点的子树开始调整，一直调整到根节点的树，就可以调整成堆。

3.3.3 建堆时间复杂度

因为堆是完全二叉树，而满二叉树也是完全二叉树，此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值，多几个节点不影响最终结果)：

因此，建堆的时间复杂度为O(N)

3.3.4 堆的插入

3.3.5 堆的删除

删除堆是删除堆顶的数据，将堆顶的数据根最后一个数据一换，然后删除数组最后一个数据，再进行向下调整算法。

3.3.6 堆的具体代码

https://gitee.com/hrimkn/c_code

如果想下载参考代码可以点击此链接。

Heap.h

#pragma once
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <stdbool.h>

typedef int HPDataType;

typedef struct Heap
{
	HPDataType* a;
	int size;
	int capacity;
}Heap;

// 堆的初始化
void HeapCreate(Heap* hp);

// 堆的销毁
void HeapDestory(Heap* hp);

// 堆的插入
void HeapPush(Heap* hp, HPDataType x);

// 堆的删除
void HeapPop(Heap* hp);

// 取堆顶的数据
HPDataType HeapTop(Heap* hp);

// 堆的数据个数
int HeapSize(Heap* hp);

// 堆的判空
bool HeapEmpty(Heap* hp);

//打印堆
void PrintHeap(Heap* hp);

void AdjustDown(HPDataType* a, int n, int parent);

void swap(HPDataType* p1, HPDataType* p2);

Heap.c

#include "Heap.h"

// 堆的初始化
void HeapCreate(Heap* hp)
{
	assert(hp);
	hp->a = NULL;
	hp->capacity = hp->size = 0;
}

// 堆的销毁
void HeapDestory(Heap* hp)
{
	assert(hp);
	free(hp->a);
	hp->a = NULL;
	hp->capacity = hp->size = 0;
}

void swap(HPDataType*p1, HPDataType*p2)
{
	HPDataType tmp = *p1;
	*p1 = *p2;
	*p2 = tmp;
}

//向上调整
void AdjustUp(HPDataType* a, int child)
{
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (a[child] < a[parent])
		{
			swap(&a[child], &a[parent]);
			child = parent;
			parent = (child - 1) / 2;
		}
		else
			break;
	}
}

// 堆的插入
void HeapPush(Heap* hp, HPDataType x)
{
	assert(hp);
	//检查是否需要扩容
	if (hp->size == hp->capacity)
	{
		int newcapacity = hp->capacity == 0 ? 4 : hp->capacity * 2;
		HPDataType* tmp = (HPDataType*)realloc(hp->a, sizeof(HPDataType) * newcapacity);
		if (tmp == NULL)
		{
			perror("realloc fail");
			exit(-1);
		}
		hp->a = tmp;
	}

	hp->a[hp->size] = x;
	hp->size++;
	AdjustUp(hp->a, hp->size - 1);
}

void AdjustDown(HPDataType* a,int n,int parent)
{
	int minchild = parent * 2 + 1;
	while (minchild < n)
	{
		if ( minchild+1 < n && a[minchild] < a[minchild + 1] )
		{
			minchild++;
		}

		if (a[minchild] > a[parent])
		{
			swap(&a[minchild], &a[parent]);
			parent = minchild;
			minchild = parent * 2 + 1;
		}
		else
			break;
	}
}

// 堆的删除
void HeapPop(Heap* hp)
{
	assert(hp);
	assert(!HeapEmpty(hp));
	swap(&hp->a[0], &hp->a[hp->size - 1]);
	hp->size--;

	AdjustDown(hp->a, hp->size, 0);
}

// 取堆顶的数据
HPDataType HeapTop(Heap* hp)
{
	if (hp->size == 0)
		return 0;
	return hp->a[0];
}

// 堆的数据个数
int HeapSize(Heap* hp)
{
	return hp->size - 1;
}

// 堆的判空
bool HeapEmpty(Heap* hp)
{
	return hp->size == 0;
}

//打印堆
void PrintHeap(Heap* hp)
{
	for (int i = 0; i < hp->size; i++)
	{
		printf("%d ", hp->a[i]);
	}
	printf("\n");
}

4.二叉树链式结构的实现

4.1 前置说明

在学习二叉树的基本操作前，需先要创建一棵二叉树，然后才能学习其相关的基本操作。由于现在对二叉树结构掌握还不够深入，为了降低学习成本，此处手动快速创建一棵简单的二叉树，快速进入二叉树操作学习，等二叉树结构了解的差不多时，我们反过头再来研究二叉树真正的创建方式。

同时，二叉树链式结构的大部分代码都是通过递归实现的，代码写起来比较简单，但是理解过程我自己认为十分困难，但理解之后，对于二叉树的操作可以说是得心应手。所以各位在学习这一部分时不要着急，仔细思考之后可能在某一瞬间就会豁然开朗。体会到‘‘山重水复疑无路，柳暗花明又一村”的感觉！

注意：下面是二叉树链式结构的创建函数，我是在学完二叉树才写出来的这个函数，因此初学者大致看一遍跳过即可，等最后可以回过头来再思考。

//二叉树链式结构的构建函数
#include <stdio.h>
#include <stdlib.h>
struct TreeNode {
    char data;
    struct TreeNode *left;
    struct TreeNode *right;
};

struct TreeNode* CreatTree(char* a,int* pi)
{
    if(a[*pi] == '#')
    {
        (*pi)++;
        return NULL;
    }
    struct TreeNode* root =(struct TreeNode*)malloc(sizeof(struct TreeNode));
    if(root == NULL)
    {
        perror("malloc error");
        return NULL;
    }
    
    root->data = a[*pi];
    (*pi)++;
    root->left = CreatTree(a, pi);
    root->right = CreatTree(a, pi);
    return root;
}

我们先来回顾一下上文提到的二叉树的概念，二叉树是：

1. 空树
2. 非空：根节点，根节点的左子树、根节点的右子树组成的。

从概念中可以看出，二叉树定义是递归式的，因此后序基本操作中基本都是按照该概念实现的

//二叉树简单无脑的创建方式
typedef int BTDataType;
typedef struct BinaryTreeNode
{
    BTDataType _data;
    struct BinaryTreeNode* left;
    struct BinaryTreeNode* right;
}BTNode;
BTNode* CreateTree()
{
	BTNode* n1 = (BTNode*)malloc(sizeof(BTNode));
	assert(n1);
	BTNode* n2 = (BTNode*)malloc(sizeof(BTNode));
	assert(n2);
	BTNode* n3 = (BTNode*)malloc(sizeof(BTNode));
	assert(n3);
	BTNode* n4 = (BTNode*)malloc(sizeof(BTNode));
	assert(n4);
	BTNode* n5 = (BTNode*)malloc(sizeof(BTNode));
	assert(n5);
	BTNode* n6 = (BTNode*)malloc(sizeof(BTNode));
	assert(n6);

	n1->data = 1;
	n2->data = 2;
	n3->data = 3;
	n4->data = 4;
	n5->data = 5;
	n6->data = 6;

	n1->left = n2;
	n1->right = n4;
	n2->left = n3;
	n2->right = NULL;
	n4->left = n5;
	n4->right = n6;
	n3->left = NULL;
	n3->right = NULL;
	n5->left = NULL;
	n5->right = NULL;
	n6->left = NULL;
	n6->right = NULL;

	return n1;
}

请先用上面的代码简单地创建图中的二叉树，方便理解下面要提到的内容，同时也方便自己进行调试代码。

4.2 二叉树的遍历

4.2.1 前序、中序以及后序遍历

学习二叉树结构，最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则，依次对二叉树中的节点进行相应的操作，并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。遍历是二叉树上最重要的运算之一，也是二叉树上进行其它运算的基础。
按照规则，二叉树的遍历有：前序/中序/后序的递归结构遍历：

前序遍历(Preorder Traversal )——访问根结点的操作发生在遍历其左右子树之前。
中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中（间）。
后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。

我先给出上图中二叉树三种遍历的结果

前序遍历（根左右）： 1 2 3 4 5 6
中序遍历（左根右）： 3 2 1 5 4 6
后序遍历（左右根）： 3 2 5 6 4 1

现在请看一下结果，不必考虑为什么，等看完下面的内容后再回过头来想一想这么写合适不合适，如果看出来不合适的地方，那么就可以恭喜你了！

此外由于被访问的结点必是某子树的根，所以N(Node）、L(Left subtree）和R(Right subtree）又可解释为根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。（了解这种叫法即可）

二叉树的前序、中序以及后序遍历原理相同，只需要了解一种的实现方式便可以融汇贯通，因此在这里我就以前序为例展开。

前序遍历详解：

请再读一遍前序遍历的概念：访问根结点的操作发生在遍历其左右子树之前。

也就是说遍历二叉树的时候先访问根节点然后访问根的左子树最后访问根的右子树

首先看下面的图片将这个二叉树的根节点传给前序遍历函数，（请图文一起观看）

第一步：根节点为1，左子树是2，右子树是4 。访问顺序是根左右，访问根即访问1，然后访问根的左子树，即访问根为2的这颗子树，这里也就是二叉树最重要的操作递归，注意是子树，而不是2这个节点
第二步：此时根节点为2，左子树是3 右子树是空。访问顺序同样是根左右，访问根节点也就是访问1，然后访问左子树。
第三步：此时根节点为3，左右都是空。访问顺序根左右，注意此时左右都是叶子节点，也就不需要再继续递归了，按照根左右的顺序即访问了 3 NULL NULL。
第四步：现在要开始回退了。递归到叶子节点后开始回退，根为3的这棵树是2的左子树，现在回看第二步，以及访问完根为2的这颗树的根左子树，接下来就是右子树，右子树为空，也就是访问了NULL。
现在回退到了第一步，访问完了根为1的树的根左子树，然后就是右子树，即根为4的树，访问根为4的这棵树同样是按照根左右的顺序，和上面的顺序相同，请各位独自思考访问的过程。
所以最后，整个树的前序遍历结果就是1 2 3 N N N 4 5 N N 6 N N(N代表空)

所以现在你理解了整个过程，是不是发现上面我一开始给出的结果有些许不妥。

理解前序遍历之后，请自己写出中序和后序遍历带NULL的结果。

下面是具体代码，中序和后序遍历只需要调换一下顺序即可。

相信你看懂了上面的过程，很轻松就能写出代码。

// 二叉树前序遍历
void PreOrder(BTNode* root)
{
	if (root == NULL)
	{
		printf("NULL ");
		return;
	}

	printf("%d ", root->data);
	PreOrder(root->left);
	PreOrder(root->right);
}

4.2.2 层序遍历

层序遍历：除了先序遍历、中序遍历、后序遍历外，还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1，层序遍历就是从所在二叉树的根节点出发，首先访问第一层的树根节点，然后从左到右访问第2层上的节点，接着是第三层的节点，以此类推，自上而下，自左至右逐层访问树的结点的过程就是层序遍历。

由于上面语言叙述前序遍历过程实在过于麻烦，消耗了我太多精力，层序遍历的过程更加麻烦，并且使用到了队列，所以这里我就跳过了直接看代码吧。十分抱歉！（之后我会想好怎么叙述更清楚会更新讲解）

void TreeLevelOrder(BTNode* root)
{
	Queue q;
	QueueInit(&q);
	if (root)
		QueuePush(&q, root);

	while (!QueueEmpty(&q))
	{
		BTNode* front = QueueFront(&q);
		QueuePop(&q);
		printf("%d ", front->data);

		// 下一层，入队列
		if (front->left)
			QueuePush(&q, front->left);

		if (front->right)
			QueuePush(&q, front->right);
	}
	printf("\n");

	QueueDestroy(&q);
}