数据结构之—树
重点概念
结点
结点里面一般包含数据,和其他信息,(链结点有数据和下一个结点的引用)
树节点
该文章所提及的结点为树节点
树
定义
**树(Tree)**是n(n>=0)个结点的有限集。n=0时称为空树。在任意一颗非空树中: 1)有且仅有一个特定的称为根(Root)的结点; 2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1、T2、…、Tn,其中每一个集合本身又是一棵树,并且称为根的子树。
此外,树的定义还需要强调以下两点: 1)根结点是唯一的,不可能存在多个根结点,数据结构中的树只能有一个根结点。 2)子树的个数没有限制,但它们一定是互不相交的。
如图,是一棵普通树
由树的定义可以看出,树的定义使用了递归的方式。递归在树的学习过程中起着重要作用,如果对于递归不是十分了解,建议先看看递归算法
度数
结点拥有的子树数目称为结点的度。
结点关系
- 孩子结点
- 双亲结点
- 兄弟结点
结点层次
从根开始定义起,根为第一层,根的孩子为第二层,以此类推。
树的深度
树中结点的最大层次,如上图深度为4
二叉树
二叉树定义
二叉树是n(n>=0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树组成。 如图为普通二叉树
二叉树的特点
- 二叉树不存在结点大于2的结点
- 左子树和右子树有顺序,次序不能任意颠倒。
- 即使树种某节点只有一颗子树,也要区分是左子树还是右子树。
二叉树性质
- 在二叉树的第i层上最多有 2^i-1 个节点 。
- 二叉树中如果深度为k,那么最多有2^k-1个节点。(k>=1)
- n0=n2+1 n0表示度数为0的节点数,n2表示度数为2的节点数。
- 在完全二叉树中,具有n个节点的完全二叉树的深度为[log2n]+1,其中[log2n]是向下取整
- 若对含 n 个结点的完全二叉树从上到下且从左至右进行 1 至 n 的编号,则对完全二叉树中任意一个编号为 i 的结点有如下
(1) 若 i=1,则该结点是二叉树的根,无双亲, 否则,编号为 [i/2] 的结点为其双亲结点; (2) 若 2i>n,则该结点无左孩子结点, 否则,编号为 2i 的结点为其左孩子结点; (3) 若 2i+1>n,则该结点无右孩子结点, 否则,编号为2i+1 的结点为其右孩子结点
斜树
斜树:所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。
左斜树
右斜树
满二叉树
在一棵二叉树中。如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
特点有:
- 叶子只能出现在最下一层。出现在其它层就不可能达成平衡。
- 非叶子结点的度一定是2。
- 在同样深度的二叉树中,满二叉树的结点个数最多,叶子数最多。
完全二叉树
对一颗具有n个结点的二叉树按层编号,如果编号为i(1<=i<=n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树。编号跟满二叉树一样的
特点:
- 叶子结点只能出现在最下层和次下层。
- 最下层的叶子结点集中在树的左部。
- 倒数第二层若存在叶子结点,一定在右部连续位置。
- 如果结点度为1,则该结点只有左孩子,即没有右子树。
- 同样结点数目的二叉树,完全二叉树深度最小。 注:满二叉树一定是完全二叉树,但反过来不一定成立。
二叉树的存储结构
顺序存储
二叉树的顺序存储结构就是使用一维数组存储二叉树中的结点,并且结点的存储位置,就是数组的下标索引。
采用顺序存储方式为:
当二叉树不为完全二叉树时,该顺序存储结构又是如何?
其中浅色结点表示结点不存在,那么其存储结构为
但是在左斜树,右斜树这些极端情况下,采用顺序存储十分浪费空间。因此,顺序存储一般适用于完全二叉树
二叉链表存储
既然顺序存储不能满足二叉树的存储需求,那么考虑采用链式存储。由二叉树定义可知,二叉树的每个结点最多有两个孩子。因此,可以将结点数据结构定义为一个数据和两个指针域。定义如图:
class Node TreeNode{
T data;//数据
TreeNode left;
TreeNode right;
}
上面的链表称为二叉链表
二叉树的遍历
二叉树的遍历一个重点考查的知识点。
定义
二叉树的遍历是指从二叉树的根结点出发,按照某种次序依次访问二叉树中的所有结点,使得每个结点被访问一次,且仅被访问一次。 二叉树的访问次序可以分为四种:先序遍历(前序遍历)、中序遍历、后序遍历、层次遍历
其中使用的遍历就是递归遍历,由上自下,从左到右,每个节点会走三次。
前序遍历
前序遍历通俗的说就是从二叉树的根结点出发,当第一次到达结点时就输出结点数据,按照先向左在向右的方向访问。
先序遍历的结果: ABDHIEJCFG
中序遍历
中序遍历就是从二叉树的根结点出发,当第二次到达结点时就输出结点数据,按照先向左再向右的方向访问。
中序遍历输出为:HDIBJEAFCG
后序遍历
后序遍历就是从二叉树的根结点出发,当第三次到达结点时就输出结点数据,按照先向左再向右的方向访问。
后序遍历输出为:HIDJEBFGCA
层次遍历
层次遍历就是按照树的层次自上而下的遍历二叉树。针对图3.13所示二叉树的层次遍历结果为: ABCDEFGHIJ
相关代码
public class Test1 {
static class Node{
private Integer data;
private Node left,right;
public Node(Integer data) {
this.data = data;
}
}
public static void preOrder(Node node){
if(node==null){
return;
}
System.out.println(node.data);
preOrder(node.left);
preOrder(node.right);
}
public static void inOrder(Node node){
if(node==null){
return;
}
inOrder(node.left);
System.out.println(node.data);
inOrder(node.right);
}
public static void postOrder(Node node){
if(node==null){
return;
}
postOrder(node.left);
postOrder(node.right);
System.out.println(node.data);
}
public static void main(String[] args) {
Node root = new Node(1);
root.left = new Node(2);
root.right = new Node(3);
root.left.left = new Node(4);
root.left.right = new Node(5);
root.right.left = new Node(6);
root.right.right = new Node(7);
preOrder(root);
System.out.println("====先序遍历====");
inOrder(root);
System.out.println("====中序遍历====");
postOrder(root);
System.out.println("====后续遍历====");
}
}
不用递归,用栈实现先序,效率高一点
public static void stackPreOrder(Node node){
Stack<Node> stack=new Stack<>();
stack.add(node);
while (stack.size()>0){
Node head = stack.pop();
System.out.println(head.data);
if(head.right!=null){
stack.add(head.right);
}
if(head.left!=null){
stack.add(head.left);
}
}
}
其他的树的分类
二叉查找树(又叫做二叉搜索树,二叉排序树)
特征:
- 若左子树不为空,那么左子树所有节点的值小于均小于他的根节点的值。
- 若右子树不为空,那么右子树的所有节点的值大于根节点的值。
- 左右子树也分别为二叉排序树。
- 没有键值相等的节点。
二叉排序树查找操作
public class BinaryTree {
public static void main(String[] args) {
// 主要是表达查询,所以手动构造一棵二叉排序树
TreeNode binaryTree1 = new TreeNode();
binaryTree1.data = 62;
TreeNode binaryTree2 = new TreeNode();
binaryTree1.lchild = binaryTree2;
binaryTree2.data = 58;
TreeNode binaryTree3 = new TreeNode();
binaryTree2.lchild = binaryTree3;
binaryTree3.data = 47;
TreeNode binaryTree4 = new TreeNode();
binaryTree3.lchild = binaryTree4;
binaryTree4.data = 35;
TreeNode binaryTree5 = new TreeNode();
binaryTree4.rchild = binaryTree5;
binaryTree5.data = 37;
TreeNode binaryTree6 = new TreeNode();
binaryTree3.rchild = binaryTree6;
binaryTree6.data = 51;
TreeNode binaryTree7 = new TreeNode();
binaryTree1.rchild = binaryTree7;
binaryTree7.data = 88;
TreeNode binaryTree8 = new TreeNode();
binaryTree7.lchild = binaryTree8;
binaryTree8.data = 73;
TreeNode binaryTree9 = new TreeNode();
binaryTree7.rchild = binaryTree9;
binaryTree9.data = 99;
TreeNode binaryTree10 = new TreeNode();
binaryTree9.lchild = binaryTree10;
binaryTree10.data = 93;
TreeNode treeNode = serachBinaryTree(binaryTree1, 35000);
System.out.println(treeNode == null ? "没有这个数" : treeNode.data);
}
/**
* 二叉排序树
*
* @param root
* 待查询的二叉排序树
* @param target
* 查找关键字
* @return 没有返回null,有则返回节点
*/
public static TreeNode searchBinaryTree(TreeNode root, int target) {
if (root == null) { // 树节点不存在,返回
return null;
} else if (target == root.data) { // 查找成功
return root;
} else if (target < root.data) { // 关键字小于根节点查找左子树
return searchBinaryTree(root.lchild, target);
} else { // 关键字大于根节点查找右子树
return searchBinaryTree(root.rchild, target);
}
}
/**
* 二叉树,数据结构
*
*/
private static class TreeNode {
int data;
TreeNode lchild;
TreeNode rchild;
}
}
平衡二叉树(AVL树)
含有相同节点的二叉查找树可以有不同的形态,而二叉查找树的平均查找长度与树的深度有关,所以需要找出一个查找平均长度最小的一棵,那就是平衡二叉树
特点:
- 要么是棵空树,要么其根节点左右子树的深度之差的绝对值不超过1
- 其左右子树也都是平衡二叉树
- 叉树节点的平衡因子定义为该节点的左子树的深度减去右子树的深度。则平衡二叉树的所有节点的平衡因子只可能是-1,0,1。
红黑树
红黑树是一种自平衡二叉树,在平衡二叉树的基础上每个节点又增加了一个颜色的属性,节点的颜色只能是红色或黑色。
特点:
- 根节点只能是黑色
- 红黑树中所有的叶子节点后面再接上左右两个空节点,这样可以保持算法的一致性,而且所有的空节点都是黑色;
- 其他的节点要么是红色,要么是黑色,红色节点的父节点和左右孩子节点都是黑色,及黑红相间
- 在任何一棵子树中,从根节点向下走到空节点的路径上所经过的黑节点的数目相同,从而保证了是一个平衡二叉树
B-树(也叫B树)
B-树是一种平衡多路查找树,它在文件系统中很有用。
一棵m阶B-树(图为4阶B-树),具有下列性质:
- 树中每个节点至多有m棵子树
- 若根节点不是叶子节点,则至少有2棵子树
- 除根节点之外的所有非终端节点至少有棵子树;
- 每个节点中的信息结构为(A0,K1,A1,K2…Kn,An),其中n表示关键字个数,Ki为关键字,Ai为指针
- 所有的叶子节点都出现在同一层次上,且不带任何信息,也是为了保持算法的一致性。
B+树
B+数是B-树的一种变形,它与B-树的差别在于(图为3阶B+树):
- 有n棵子树的节点含有n个关键字
- 所有的叶子节点包含了全部关键字的信息,及指向这些关键字记录的指针,且叶子节点本身按关键字大小自小到大顺序链接
- 所有非终端节点可以看成是索引部分,节点中仅含有其子树(根节点)中最大(或最小)关键字,所有B+树更像一个索引顺序表
- 对B+树进行查找运算,一是从最小关键字起进行顺序查找,二是从根节点开始,进行随机查找。