一、二叉查找树(Binary Search Tree)
二叉查找树,也叫二叉搜索树,要求树中任意一个节点,左子树中每个节点的值,小于这个节点的值;右子树节点的值都大于这个节点的值。
1. 二叉查找树的查找操作
查找二叉树的的查找操作,先取根节点,根据节点数据的大小决定下一步向左子树还是右子树递归查找,最后返回相等的值。
public class BinarySearchTree {
private Node tree;
public Node find(int data) {
Node p = tree;
while (p != null) {
if (data < p.data) p = p.left;
else if (data > p.data) p = p.right;
else return p;//相等的情况下
}
return null;
}
public static class Node {//定义Node类
private int data;
private Node left;
private Node right;
public Node(int data) {
this.data = data;
}
}
}
2. 二叉查找树的插入操作
同样,从根节点开始比较数据的大小关系,根据要插入数据与根节点的比较,决定插入到左子树或右子树中,递归遍历。如果查找过程中,左子树/右子树为空,则将新数据插入到为空的节点中。
public void insert(int data) {
if (tree == null) {//空的情况,新建一个树
tree = new Node(data);
return;
}
Node p = tree;
while (p != null) {
if (data > p.data) {
if (p.right == null) {//右子树是空就插右边
p.right = new Node(data);
return;
}
p = p.right;
} else { // data < p.data
if (p.left == null) {//左子树是空就插左边
p.left = new Node(data);
return;
}
p = p.left;
}
}
}
3. 二叉查找树的删除操作
删除操作分为三种情况:
- 如果删除的节点没有子节点,直接将要删除的节点指针置为null。例如图中55。
- 如果删除的节点只有一个子节点,更新要删除节点的父节点,使其指向要删除节点的子节点。例如图中13。
- 如果删除的节点有两个子节点,先找右子树最小节点,将其替换到要删除的节点上,再删除这个最小节点。例如图中18。
删除代码:
public void delete(int data) {
Node p = tree; // p指向要删除的节点,初始化指向根节点
Node pp = null; // pp记录的是p的父节点
while (p != null && p.data != data) {
pp = p;
if (data > p.data) p = p.right;
else p = p.left;
}
if (p == null) return; // 没有找到
// 要删除的节点有两个子节点
if (p.left != null && p.right != null) { // 查找右子树中最小节点
Node minP = p.right;
Node minPP = p; // minPP表示minP的父节点
while (minP.left != null) {
minPP = minP;
minP = minP.left;
}
p.data = minP.data; // 将minP的数据替换到p中
p = minP; // 下面就变成了删除minP了
pp = minPP;
}
// 删除节点是叶子节点或者仅有一个子节点
Node child; // p的子节点
if (p.left != null) child = p.left;
else if (p.right != null) child = p.right;
else child = null;
if (pp == null) tree = child; // 删除的是根节点
else if (pp.left == p) pp.left = child;
else pp.right = child;
}
4. 二叉查找树的其他操作
除此之外,二叉树查找还支持快速查找最大节点、最小节点、前驱结点和后继结点。以及中序遍历查找二叉树,可以输出有序的数据序列,时间复杂度为
O
(
n
)
O(n)
O(n)。
当数据不是数字,而是包含很多字段的对象时,利用对象的某个段作为键值(key)来构建二叉查找树,此时对象中的其他字段叫做卫星数据。
数据相同时
- 通过链表和支持动态扩容的数组等数据结构,把值相同的数据存储在一个节点上、
- 将相同数据看作大于这个节点的数据来处理,放在右子树。
用第二种方法,在查找时,找到数据后不停止查找操作,而是在右子树继续查找,直到遇到叶子结点才停止。
用第二种方法,在删除时,与查找的情况相同,先查找到每个要删除的节点,再依次删除。
二、查找二叉树的时间复杂度
下图三种查找二叉树的时间复杂度都不同,时间复杂度与树的高度成正比:
对退化成链表的情况,也就是最坏时间复杂度为
O
(
n
)
O(n)
O(n),对于理想情况,一个结点数为n的完全二叉树,它包含的节点个数在1到
2
(
L
−
1
)
2^{(L-1)}
2(L−1)之间(假设最大层数为L),n满足:
n >= 1+2+4+8+...+2^(L-2)+1
n <= 1+2+4+8+...+2^(L-2)+2^(L-1)
由等比数列公式,L的范围是 [ l o g 2 ( n + 1 ) , l o g 2 n + 1 ] [log_2(n+1),log_2n+1] [log2(n+1),log2n+1],也就是树的高度小于等于 l o g 2 n + 1 log_2n+1 log2n+1。理想情况下时间复杂度为 O ( l o g n ) O(logn) O(logn)。 (平衡二叉查找树可以保持在理想范围)
三、二叉查找树的优点
- 只需中序遍历,就可以在 O ( n ) O(n) O(n)内输出有序的数据序列。
- 散列表在遇到散列冲突时性能不稳定,但常用的平衡二叉查找树时间复杂度稳定在 O ( l o g n ) O(logn) O(logn)。
- 散列表要考虑散列函数的设计、冲突的解决办法、扩容缩容等。而平衡二叉查找树只需考虑平衡性问题。