一、重点概念
1.1 结点概念
结点是数据结构中的基础,是构成复杂数据结构的基本组成单位。
1.2 树结点声明
本系列中提及的结点专指树的结点。
二、 树
2.1 定义
树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。
在任意一颗非空树中:
1)有且仅有一个特定的称为根(Root)的结点;
2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、…、Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
此外,树的定义还需要强调以下两点:
1)根结点是唯一的,不可能存在多个根结点,数据结构中的树只能有一个根结点。
2)子树的个数没有限制,但它们一定是互不相交的。
下图为一棵普通的树:
由树的定义可以看出,树的定义使用了递归的方式。递归在树的学习过程中起着重要作用,如果对于递归不是十分了解,建议先看看递归算法
2.2 结点的度
结点拥有的子树数目称为结点的度。
2.3 结点关系
某个结点的子树的根结点为该结点的孩子结点。如上图B是A的孩子节点
相应该结点称为孩子结点的双亲结点(父节点)。如上图A是B和C的父节点(双亲节点)
2.4 结点层次
从根开始定义起,根为第一层,根的孩子为第二层,以此类推。
如下图:表示了树的层次关系
2.5 树的深度
树中结点的最大层次数称为树的深度或高度。如上图中的树深度为4
三、 二叉树
3.1 定义
二叉树是n(n>=0)个结点的有限集合,或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树组成。 下图展示了一棵普通二叉树:
3.2 二叉树特点
由二叉树定义以及图示分析得出二叉树有以下特点:
1)每个结点最多有两棵子树,所以二叉树中不存在度大于2的结点。
2)左子树和右子树是有顺序的,次序不能任意颠倒。
3)即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。
3.3 二叉树性质(理解就好)
1)在二叉树的第i层上最多有 2^(i - 1) 个节点 。(i>=1)
2)二叉树中如果深度为k,那么最多有2^k - 1个节点。(k>=1)
3)n0=n2+1, 其中n0表示度数为0的节点数,n2表示度数为2的节点数。
4)在完全二叉树中,具有n个节点的完全二叉树的深度为[log2n]+1,其中[log2n]是向下取整。
完全二叉树的定义:一棵深度为k的有n个结点的二叉树,对树中的结点按从上至下、从左到右的顺序进行编号,如果编号为i(1≤i≤n)的结点与满二叉树中编号为i的结点在二叉树中的位置相同,则这棵二叉树称为完全二叉树。(百度百科)简单来说就是从左到右标序号后,和满二叉树中的序号不变,如果不是很理解,当然后面也有介绍,看完完全二叉树,可以再来看看这个性质。
5)若对含 n 个结点的完全二叉树从上到下且从左至右进行 1 至 n 的编号,则对完全二叉树中任意一个编号为 i 的结点有如下特性:
(1) 若 i=1,则该结点是二叉树的根,无双亲, 否则,编号为 [i/2] 的结点是编号 i 的双亲结点;
(2) 若 2i>n,则该结点无左孩子结点, 否则,编号为 2i 的结点为编号 i 的左孩子结点;
(3) 若 2i+1>n,则该结点无右孩子结点, 否则,编号为2i+1 的结点为编号 i + 1 的右孩子结点。
3.4 斜树
斜树:所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。
如下为左斜树
如下为右斜树
3.5 满二叉树
满二叉树:在一棵二叉树中。如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
满二叉树的特点有:
1)叶子只能出现在最下一层。出现在其它层就不可能达成平衡。
2)非叶子结点的度一定是2。
3)在同样深度的二叉树中,满二叉树的结点个数最多,叶子数最多。
如下图就是一个满二叉树
3.6 完全二叉树
完全二叉树:对一颗具有n个结点的二叉树按层编号,如果编号为i(1<=i<=n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。
如下图就是一棵完全二叉树(满足上述定义)
特点:
1)叶子结点只能出现在最下层和次下层。
2)最下层的叶子结点集中在树的左部。
3)倒数第二层若存在叶子结点,一定在右侧。
4)如果结点度为1,则该结点只有左孩子,即没有右子树。
5)如果结点数目相同,总是有二叉树的深度≥完全二叉树深度。
注:满二叉树一定是完全二叉树,但反过来不一定成立。
3.7 二叉树的存储结构
3.7.1 顺序存储
二叉树的顺序存储结构就是使用一维数组存储二叉树中的结点,并且结点的存储位置,就是数组的下标索引。
上图所示的一棵完全二叉树采用顺序存储方式,表示如下:
由图可以看出,当二叉树为完全二叉树时,结点数刚好填满数组。
那么当二叉树不为完全二叉树时,采用顺序存储形式如何呢?
例如:对于下图描述的二叉树:其中浅紫色结点表示结点不存在。
上图所示的二叉树的顺序存储结构如下:
其中,∧表示数组中此位置没有存储结点。此时可以发现,顺序存储结构中已经出现了空间浪费的情况。 那么对于右斜树极端情况
对应的顺序存储结构如下图:
可以看出,对于这种右斜树极端情况,采用顺序存储的方式是十分浪费空间的。因此,顺序存储一般适用于完全二叉树。
3.7.2 二叉链表
既然顺序存储不能满足二叉树的存储需求,那么考虑采用链式存储。
由二叉树定义可知,二叉树的每个结点最多有两个孩子。因此,可以将结点数据结构定义为一个数据和两个指针域。表示方式如下图所示:
定义结点代码:
public class TreeNode<T> {
T data;
TreeNode left;
TreeNode right;
}
上图二叉树可以用如下图表示:下图采用一种链表结构存储二叉树,这种链表称为二叉链表。
3.8 二叉树遍历
二叉树的遍历—重点考查的知识点。
3.8.1 定义
二叉树的遍历是指从二叉树的根结点出发,按照某种次序依次访问二叉树中的所有结点,使得每个结点被访问一次,且仅被访问一次。
二叉树的访问次序可以分为四种:
- 前序遍历 根结点 > 左子树 > 右子树
- 中序遍历 左子树> 根结点 > 右子树
- 后序遍历 左子树 > 右子树 > 根结点
- 层序遍历 仅仅需按层次遍历就可以
3.8.2 前序遍历
前序遍历通俗的说就是从二叉树的根结点出发,当第一次到达结点时就输出结点数据,按照先向左在向右的方向访问。
先序遍历的结果: ABDHIEJCFG
3.8.3 中序遍历
中序遍历就是从二叉树的根结点出发,当第二次到达结点时就输出结点数据,按照先向左再向右的方向访问。
中序遍历输出为:HDIBJEAFCG
#3.8.4 后序遍历
后序遍历就是从二叉树的根结点出发,当第三次到达结点时就输出结点数据,按照先向左再向右的方向访问。
后序遍历输出为:HIDJEBFGCA
#3.8.5 层次遍历
层次遍历就是按照树的层次自上而下的遍历二叉树。
层次遍历输出: ABCDEFGHIJ
层次遍历的详细方法可以参考二叉树的按层遍历法open in new window
代码实现,总共是7个节点的满二叉树,从左到右编号1-7
public class RecursiveBinaryTree {
public static class Node{
public int value;
public Node left;
public Node right;
public Node(int v){
this.value = v;
}
}
//先序遍历
public static void PreOrder(Node root){
if (root == null){
return;
}
System.out.println(root.value);
PreOrder(root.left);
PreOrder(root.right);
}
//中序遍历
public static void InOrder(Node root){
if (root == null){
return;
}
InOrder(root.left);
System.out.println(root.value);
InOrder(root.right);
}
//后序遍历
public static void PostOrder(Node root){
if (root == null){
return;
}
PostOrder(root.left);
PostOrder(root.right);
System.out.println(root.value);
}
public static void main(String[] args) {
Node root = new Node(1);
Node left = new Node(2);
Node right = new Node(3);
root.left = left;
root.right = right;
left.left = new Node(4);
left.right = new Node(5);
right.left = new Node(6);
right.right = new Node(7);
System.out.println("先序遍历");
PreOrder(root);
System.out.println("中序遍历");
InOrder(root);
System.out.println("后序遍历");
PostOrder(root);
}
}
不利用递归,通过栈实现先序,效率要高一些
public class UnRecursiveBinaryTree {
public static class Node{
public int value;
public Node left;
public Node right;
public Node(int v){
this.value = v;
}
}
public static void PreOrder(Node node){
System.out.println("先序遍历");
if (node != null){
//创建一个栈,并将节点压入
Stack<Node> stack = new Stack<>();
stack.add(node);
while (!stack.empty()){
//这一步很关键,每次出栈后的节点需要更新,方便后续把左右子树入栈,进行出栈,保障先序遍历
node = stack.pop();
System.out.println(node.value);
//右子树先进栈,因为栈的性质,先进后出
if (node.right != null){
stack.push(node.right);
}
if (node.left != null){
stack.push(node.left);
}
}
}
}
public static void main(String[] args) {
Node root = new Node(1);
Node left = new Node(2);
Node right = new Node(3);
root.left = left;
root.right = right;
left.left = new Node(4);
left.right = new Node(5);
right.left = new Node(6);
right.right = new Node(7);
PreOrder(root);
}
}
四、其他的树的分类
1.二叉查找树(又叫做二叉搜索树,二叉排序树)
特征:
- 若左子树不为空,那么左子树所有节点的值小于均小于他的根节点的值。
- 若右子树不为空,那么右子树的所有节点的值大于根节点的值。
- 左右子树也分别为二叉排序树。
- 没有键值相等的节点。
二叉排序树查找操作
代码实现及测试
public class BinaryTree {
class TreeNode {
int data;
TreeNode left;
TreeNode right;
}
/**
* 二叉排序树查找
* @param root 要查询的二叉排序树
* @param target 查找的值
* @return
*/
public static TreeNode searchBinaryTree(TreeNode root,int target){
if (root == null){
return null;
}else if (root.data == target){
return root;
}else if (target < root.data){
return searchBinaryTree(root.left,target);
}else {
return searchBinaryTree(root.right,target);
}
}
public static void main(String[] args) {
// 主要是表达查询,所以手动构造一棵二叉排序树
TreeNode binaryTree1 = new TreeNode();
binaryTree1.data = 62;
TreeNode binaryTree2 = new TreeNode();
binaryTree1.left = binaryTree2;
binaryTree2.data = 58;
TreeNode binaryTree3 = new TreeNode();
binaryTree2.right = binaryTree3;
binaryTree3.data = 47;
TreeNode binaryTree4 = new TreeNode();
binaryTree3.left = binaryTree4;
binaryTree4.data = 35;
TreeNode binaryTree5 = new TreeNode();
binaryTree4.right = binaryTree5;
binaryTree5.data = 37;
TreeNode binaryTree6 = new TreeNode();
binaryTree3.right = binaryTree6;
binaryTree6.data = 51;
TreeNode binaryTree7 = new TreeNode();
binaryTree1.right = binaryTree7;
binaryTree7.data = 88;
TreeNode binaryTree8 = new TreeNode();
binaryTree7.left = binaryTree8;
binaryTree8.data = 73;
TreeNode binaryTree9 = new TreeNode();
binaryTree7.right = binaryTree9;
binaryTree9.data = 99;
TreeNode binaryTree10 = new TreeNode();
binaryTree9.left = binaryTree10;
binaryTree10.data = 93;
TreeNode treeNode = searchBinaryTree(binaryTree1, 88);
System.out.println(treeNode == null ? "没有这个数" : treeNode.data);
}
}
2.平衡二叉树(AVL树)
含有相同节点的二叉查找树可以有不同的形态,而二叉查找树的平均查找长度与树的深度有关,所以需要找出一个查找平均长度最小的一棵,那就是平衡二叉树(图b),具有以下性质:
(1)要么是棵空树,要么其根节点左右子树的深度之差的绝对值不超过1;
(2)其左右子树也都是平衡二叉树;
(3)二叉树节点的平衡因子定义为该节点的左子树的深度减去右子树的深度。则平衡二叉树的所有节点的平衡因子只可能是-1,0,1。
3.红黑树
红黑树是一种自平衡二叉树,在平衡二叉树的基础上每个节点又增加了一个颜色的属性,节点的颜色只能是红色或黑色。具有以下性质:
(1)根节点只能是黑色;
(2)红黑树中所有的叶子节点后面再接上左右两个空节点,这样可以保持算法的一致性,而且所有的空节点都是黑色;
(3)其他的节点要么是红色,要么是黑色,红色节点的父节点和左右孩子节点都是黑色,及黑红相间; (4)在任何一棵子树中,从根节点向下走到空节点的路径上所经过的黑节点的数目相同,从而保证了是一个平衡二叉树。
4.B-树(也叫B树)
B-树是一种平衡多路查找树,它在文件系统中很有用。一棵m阶B-树(下图为4阶B-树),具有下列性质:
(1)树中每个节点至多有m棵子树;
(2)若根节点不是叶子节点,则至少有2棵子树;
(3)除根节点之外的所有非终端节点至少有棵子树;
(4)每个节点中的信息结构为(A0,K1,A1,K2…Kn,An),其中n表示关键字个数,Ki为关键字,Ai为指针;
(5)所有的叶子节点都出现在同一层次上,且不带任何信息,也是为了保持算法的一致性。
5.B+树
B+数是B-树的一种变形,它与B-树的差别在于(下图为3阶B+树):
(1)有n棵子树的节点含有n个关键字;
(2)所有的叶子节点包含了全部关键字的信息,及指向这些关键字记录的指针,且叶子节点本身按关键字大小自小到大顺序链接;
(3)所有非终端节点可以看成是索引部分,节点中仅含有其子树(根节点)中最大(或最小)关键字,所有B+树更像一个索引顺序表;
(4)对B+树进行查找运算,一是从最小关键字起进行顺序查找,二是从根节点开始,进行随机查找。