数据结构与算法之美——二叉树

最新推荐文章于 2023-06-30 11:44:15 发布

LemmonTreelss

最新推荐文章于 2023-06-30 11:44:15 发布

阅读量99

点赞数

分类专栏：数据结构与算法决战面试

本文链接：https://blog.csdn.net/qq_26545305/article/details/88206500

版权

决战面试同时被 2 个专栏收录

20 篇文章 2 订阅

订阅专栏

数据结构与算法

11 篇文章 3 订阅

订阅专栏

一、前言

前面我们讲的都是线性表结构，今天我们讲一种非线性表结构，树。树这种数据结构比线性表的数据结构要复杂得多，内容也比较多。

二、树

什么是树？

树是n（n≥0）个结点的有限集。n=0时称为空树。在任意一颗非空树中：(1)有且仅有一个特定的称为根（Root）的结点；（2）当n＞1时，其余结点可分为m（m＞0）个互不相交的有限集T1、T2、......Tm，其中每一个集合本身又是一颗树，并且称为根的子树（SubTree）

树里面的每个元素我们叫做“节点”；用来连线相邻节点之间的关系，我们叫作“父子关系”。上图中，A节点就是B节点的父节点。B节点是A节点的子节点。B、C的父节点是同一个节点，所以它们之间互称为兄弟节点。我们把没有父节点的结点叫作根节点。也就是图中的A节点。把没有子节点的节点叫作叶子节点或者叶节点。

关于“树”，还有三个比较相似的概念：高度（Height）、深度（Depth）、层（Level）。它们的定义如下：

示意图如下：

二、二叉树

二叉树，顾名思义，每个节点最多有两个“叉”,也就是两个子节点，分别是左子节点和右子节点。不过，二叉树并不要求每个节点都有两个子节点，有的节点只有左子节点，有的节点只有右子节点。

上图中，编号2的二叉树中，叶子节点全都在最底层，除了叶子节点之外，每个节点都有左右两个子节点，这种二叉树就叫作满二叉树。编号3的二叉树中，叶子节点都在最底下两层，最后一层的叶子节点都靠左排列，并且除了最后一层，其他层的结点个数都要达到最大，这种二叉树叫作完全二叉树。

要理解完全二叉树定义的由来，我们需要先了解，如何表示（或者存储）一颗二叉树？

想要存储一颗二叉树，我们有两种方法，一种是基于指针或者引用的二叉链式存储法，一种是基于数组的顺序存储法。

先来看链式存储法，从图中你应该可以很清楚地看到，每个节点有三个字段，其中一个存储数据，另外两个是指向左右子节点的指针。我们只要拿起根节点，就可以通过左右子节点的指针，把整颗树都串起来。这种存储方式比较常见，大部分二叉树都是通过这种结构来实现的。

再来看，基于数组的顺序存储法，我们把根节点存储在下标i=1的位置，那左子节点存储在下标2*i=2的位置，右子节点存储2*i+1=3的位置。以此类推，B节点左子节点存储在2*i=2*2=4的位置，右子节点存储在2*i+1=2*2+1=5的位置。

刚刚举的例子是一颗完全二叉树，所以仅仅“浪费”了一个下标为0的存储位置，如果是非完全二叉树，其实会浪费比较多的数组存储空间。

如果某颗二叉树是一颗完全二叉树，那用数组存储无疑是最节省内存的一种方式。因为数组的存储方式并不需要向链式存储那样，要存储额外的左右子节点的指针。这也是为什么完全二叉树单独拎出来的原因，也是为什么完全二叉树要求最后一层的子节点都靠左的原因。

堆其实就是一种完全二叉树，最常用的存储方式就是数组。

三、二叉树的遍历

如何将所有节点都遍历打印出来呢？经典的方法有三种，前序遍历、中序遍历和后序遍历。其中，前、中、后序，表示的是节点与它的左右子树节点遍历打印的先后顺序。

前序遍历是指。对于树中的任意节点来说，先打印这个节点，然后再打印它的左子树，最后打印它的右子树。

中序遍历是指。对于树中的任意节点来说，先打印它的左子树，然后再打印它本身，最后打印它的右子树。

后序遍历是指。对于树中的任意节点来说，先打印它的左子树，然后再打印它的右子树，最后打印这个节点本身。

实际上，二叉树的前、中、后序遍历就是一个递归的过程。比如，前序遍历，其实就是先打印根节点，然后再递归地打印左子树，最后递归地打印右子树。

写递归代码的关键，就是看能不能写出递推公式，而写递推公式的关键就是，如果要解决问题A，就假设子问题B、C已经解决，然后再来看如何利用B、C来解决A。

前中后序遍历的递推公式都写出如下：

前序遍历的递推公式：
preOrder(r) = print r->preOrder(r->left)->preOrder(r->right)

中序遍历的递推公式：
inOrder(r) = inOrder(r->left)->print r->inOrder(r->right)

后序遍历的递推公式：
postOrder(r) = postOrder(r->left)->postOrder(r->right)->print r

有了递推公式，代码写起来就简单多了。这三种遍历方式的代码。如下所示。

void preOrder(Node* root) {
  if (root == null) return;
  print root // 此处为伪代码，表示打印 root 节点
  preOrder(root->left);
  preOrder(root->right);
}

void inOrder(Node* root) {
  if (root == null) return;
  inOrder(root->left);
  print root // 此处为伪代码，表示打印 root 节点
  inOrder(root->right);
}

void postOrder(Node* root) {
  if (root == null) return;
  postOrder(root->left);
  postOrder(root->right);
  print root // 此处为伪代码，表示打印 root 节点
}

二叉树遍历的时间复杂度是多少呢？从前面的画的前中后序遍历的顺序图，可以看出来，每个节点最多会被访问两次，所以遍历操作的时间复杂度，跟节点的个数n成正比，也就是说二叉树遍历的时间复杂度是O(n)。

小结：

二叉树的每个节点最多有两个子节点，分别是左子节点和右子节点。二叉树中，有两种比较特殊的树，分别是满二叉树和完全二叉树。

二叉树既可以用链式存储，也可以用数组顺序存储。数组顺序存储的方式比较适合完全二叉树，其他类型的二叉树用数组存储会比较浪费存储空间。除此之外，二叉树里非常重要的操作就是前、中、后序遍历操作，遍历的时间复杂度是O(n)。需要理解并能用递归代码来实现。

LemmonTreelss

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据结构与算法之美——二叉树

一、前言前面我们讲的都是线性表结构，今天我们讲一种非线性表结构，树。树这种数据结构比线性表的数据结构要复杂得多，内容也比较多。二、树什么是树？树是n（n≥0）个结点的有限集。n=0时称为空树。在任意一颗非空树中：(1)有且仅有一个特定的称为根（Root）的结点；（2）当n＞1时，其余结点可分为m（m＞0）个互不相交的有限集T1、T2、......
复制链接

扫一扫

专栏目录