二叉搜索树的概念:
⼆叉搜索树⼜称⼆叉排序树,它或者是⼀棵空树,或者是具有以下性质的⼆叉树:
- 若它的左⼦树不为空,则左⼦树上所有结点的值都⼩于等于根结点的值;
- 若它的右⼦树不为空,则右⼦树上所有结点的值都⼤于等于根结点的值;
- 它的左右⼦树也分别为⼆叉搜索树;
- ⼆叉搜索树中可以⽀持插⼊相等的值,也可以不⽀持插⼊相等的值,具体看使⽤场景定义,后续map/set/multimap/multiset系列容器底层就是⼆叉搜索树,其中map/set不⽀持插⼊相等值,multimap/multiset⽀持插⼊相等值;
二叉搜索树的性能分析:
- 最优情况下,⼆叉搜索树为完全⼆叉树(或者接近完全⼆叉树),其⾼度为: O()
- 最差情况下,⼆叉搜索树退化为单⽀树(或者类似单⽀),其⾼度为: O()
所以综合⽽⾔⼆叉搜索树增删查改时间复杂度为: O()
那么这样的效率显然是⽆法满⾜我们需求的,我们后续需要⼆叉搜索树的变形,平衡⼆叉搜索树AVL树和红⿊树,才能适⽤于我们在内存中存储和搜索数据。
另外需要说明的是,⼆分查找也可以实现
O
(
)
级别的查找效率,但是⼆分查找有两⼤缺陷:
- 需要存储在⽀持下标随机访问的结构中,并且有序。
- 插⼊和删除数据效率很低,因为存储在下标随机访问的结构中,插⼊和删除数据⼀般需要挪动数据。
无序数组 | 二叉搜索树 | |
查找元素 | O() | O() |
插入元素 | O() | O() |
删除元素 | O() | O() |
这⾥也就体现出了平衡⼆叉搜索树的价值。
二叉搜索树的实现:
以下的实现是实现不冗余的:
就是二叉搜索树的值是各不相同的,也就是对数据节点插入二叉搜索树只有在不重复数据的情况才可以执行插入操作
定义一个节点:
template<class K>
struct BSTNode
{
BSTNode(const K& key)
:_key(key)
, _left(nullptr)
, _right(nullptr)
{}
K _key;
BSTNode<K>* _left;
BSTNode<K>* _right;
};
插入操作:
在达到插入操作,我们可以通过递归来实现:
-
递归逻辑:
- 如果当前节点为空,说明找到了插入位置,创建一个新的
TreeNode
实例并返回。 - 如果要插入的键值小于当前节点的值,递归地在左子树中插入。
- 如果要插入的键值大于当前节点的值,递归地在右子树中插入。
- 如果键值等于当前节点的值(在不允许重复值的BST中),则不进行插入。
- 如果当前节点为空,说明找到了插入位置,创建一个新的
template<class K>
class BSTree
{
public:
BSTree() : root(nullptr) {} // 构造函数初始化根节点为nullptr
// 插入函数
void insert(const K& key) {
root = insert(root, key);
}
private:
BSTNode<K>* root;
// 递归插入函数
BSTNode<K>* insert(BSTNode<K>* node, const K& key) {
if (node == nullptr) {
// 3.1 如果当前节点为空,创建并返回新节点
return new BSTNode<K>(key);
}
if (key < node->_key) {
// 3.2 如果键值小于当前节点值,递归插入左子树
node->_left = insert(node->_left, key);
}
else if (key > node->_key) {
// 3.3 如果键值大于当前节点值,递归插入右子树
node->_right = insert(node->_right, key);
}
// 3.4 如果键值等于当前节点值,不插入(BST不允许重复值)
return node;
}
};
但是,我们也可以是不适用递归实现,因为根本就没有必要用递归实现,我们可以使用循环来实现。
这种方法直接从根节点开始,逐步向下搜索合适的插入位置,直到找到空位置为止。
-
循环逻辑:
- 创建一个新的节点
newNode
,其值为要插入的键值。 - 从根节点开始,使用一个循环来寻找插入位置。
- 在循环中,比较新节点的值与当前节点的值:
- 如果新节点的值小于当前节点的值,并且当前节点的左子节点为空,则在当前节点的左侧插入新节点。
- 如果新节点的值小于当前节点的值,并且当前节点的左子节点不为空,则将当前节点设置为当前节点的左子节点,并继续循环。
- 如果新节点的值大于当前节点的值,并且当前节点的右子节点为空,则在当前节点的右侧插入新节点。
- 如果新节点的值大于当前节点的值,并且当前节点的右子节点不为空,则将当前节点设置为当前节点的右子节点,并继续循环。
- 如果循环结束还没有找到合适的插入位置,说明新节点应该插入到树的最底层。
- 创建一个新的节点
-
处理根节点:如果树为空(即根节点为
nullptr
),则新节点成为根节点。
Insert代码实现:
bool Insert(const K& key)
{
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
Node* newnode = new Node(key);
cur = newnode;
if (parent->_key < key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
查找操作:
查找逻辑:(递归,循环都可,选循环)
- 从根开始⽐较,查找x,x⽐根的值⼤则往右边⾛查找,x⽐根值⼩则往左边⾛查找;
- 最多查找⾼度次,⾛到到空,还没找到,这个值不存在;
- 如果不⽀持插⼊相等的值,找到x即可返回;
- 如果⽀持插⼊相等的值,意味着有多个x存在,⼀般要求查找中序的第⼀个x。如下图,查找3,要找到1的右孩⼦的那个3返回;
Find代码实现:
bool Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return true;
}
}
return false;
}
删除操作:(难点)
⾸先查找元素是否在⼆叉搜索树中,如果不存在,则返回false。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
- 要删除结点N左右孩⼦均为空
- 要删除的结点N左孩⼦为空,右孩⼦结点不为空
- 要删除的结点N右孩⼦为空,左孩⼦结点不为空
- 要删除的结点N左右孩⼦结点均不为空
对应以上四种情况的解决⽅案:
- 把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)
- 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点
- 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点
- ⽆法直接删除N结点,因为N的两个孩⼦⽆处安放,只能⽤替代法删除。找N左⼦树的值最⼤结点R(最右结点)或者N右⼦树的值最⼩结点R(最左结点)替代N,因为这两个结点中任意⼀个,放到N的位置,都满⾜⼆叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换,转⽽变成删除R结点,R结点符合情况2或情况3,可以直接删除。
Erase代码实现:
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
//删除
//左为空
if (!cur->_left)
{
//坑的解决(当删除的是根节点,根节点左为空时)
if (cur == _root)
{
_root = cur->_right;
}
else
{
//既是左为空,又是父亲的左孩子
if (parent->_left == cur)
{
parent->_left = cur->_right;
}
else
{
parent->_right = cur->_right;
}
}
delete cur;
return true;
}
//右为空
else if (!cur->_right)
{
if (cur == _root)
{
_root = cur->_left;
}
else
{
//既是左为空,又是父亲的左孩子
if (parent->_right == cur)
{
parent->_right = cur->_left;
}
else
{
parent->_left = cur->_left;
}
}
delete cur;
return true;
}
//左右不为空
else
{
//replace节点是我们的替代节点
//用右子树的最左节点,或者左子树的最右节点
//这里我们使用前者
Node* replaceParent = cur;//这里不要给nullptr,就怕replaceParent不进入循环,是空
Node* replace = cur->_right;
while (replace->_left)
{
replaceParent = replace;
replace = replace->_left;
}
cur->_key = replace->_key;
if (replaceParent->_left == replace)
{
replaceParent->_left = replace->_right;
}
else
{
replaceParent->_right = replace->_right;
}
delete replace;
return true;
}
}
}
return false;
}
⼆叉搜索树key和key/value使⽤场景:
key搜索场景:
只有key作为关键码,结构中只需要存储key即可,关键码即为需要搜索到的值,搜索场景只需要判断key在不在。key的搜索场景实现的⼆叉树搜索树⽀持增删查,但是不⽀持修改,修改key破坏搜索树结构了。
场景1:⼩区⽆⼈值守⻋库,⼩区⻋库买了⻋位的业主⻋才能进⼩区,那么物业会把买了⻋位的业主的⻋牌号录⼊后台系统,⻋辆进⼊时扫描⻋牌在不在系统中,在则抬杆,不在则提⽰⾮本⼩区⻋辆,⽆法进⼊。
场景2:检查⼀篇英⽂⽂章单词拼写是否正确,将词库中所有单词放⼊⼆叉搜索树,读取⽂章中的单词,查找是否在⼆叉搜索树中,不在则波浪线标红提⽰。
key/value搜索场景:
每⼀个关键码key,都有与之对应的值value,value可以任意类型对象。树的结构中(结点)除了需要存储key还要存储对应的value,增/删/查还是以key为关键字⾛⼆叉搜索树的规则进⾏⽐较,可以快速查找到key对应的value。key/value的搜索场景实现的⼆叉树搜索树⽀持修改,但是不⽀持修改key,修改key破坏搜索树结构了,可以修改value。
场景1:简单中英互译字典,树的结构中(结点)存储key(英⽂)和vlaue(中⽂),搜索时输⼊英⽂,则同时查找到了英⽂对应的中⽂。
场景2:商场⽆⼈值守⻋库,⼊⼝进场时扫描⻋牌,记录⻋牌和⼊场时间,出⼝离场时,扫描⻋牌,查找⼊场时间,⽤当前时间-⼊场时间计算出停⻋时⻓,计算出停⻋费⽤,缴费后抬杆,⻋辆离场。
场景3:统计⼀篇⽂章中单词出现的次数,读取⼀个单词,查找单词是否存在,不存在这个说明第⼀次出现,(单词,1),单词存在,则++单词对应的次数。
代码实现:
#include<iostream>
#include<string>
using namespace std;
namespace key_value
{
template<class K, class V>
struct BSTNode
{
BSTNode(const K& key, const V& value)
:_key(key)
, _value(value)
, _left(nullptr)
, _right(nullptr)
{}
K _key;
V _value;
BSTNode<K>* _left;
BSTNode<K>* _right;
};
template<class K, class V>
class BSTree
{
//typedef BSTNode<K, V> Node;
//C++11,与typedef基本一样
using Node = BSTNode<K, V>;
public:
BSTree() = default;
BSTree(const BSTree<K, V>& t)
{
_root = Copy(t._root);
}
BSTree<K, V>& operator=(BSTree<K, V> t)
{
swap(_root, t._root);
return *this;
}
~BSTree()
{
Destroy(_root);
_root = nullptr;
}
bool Insert(const K& key, const V& value)
{
if (_root == nullptr)
{
_root = new Node(key);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
return false;
}
}
Node* newnode = new Node(key, value);
cur = newnode;
if (parent->_key < key)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
return true;
}
Node* Find(const K& key)
{
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
cur = cur->_right;
}
else if (cur->_key > key)
{
cur = cur->_left;
}
else
{
return cur;
}
}
return nullptr;
}
bool Erase(const K& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_key < key)
{
parent = cur;
cur = cur->_right;
}
else if (cur->_key > key)
{
parent = cur;
cur = cur->_left;
}
else
{
//删除
//左为空
if (!cur->_left)
{
//坑的解决(当删除的是根节点,根节点左为空时)
if (cur == _root)
{
_root = cur->_right;
}
else
{
//既是左为空,又是父亲的左孩子
if (parent->_left == cur)
{
parent->_left = cur->_right;
}
else
{
parent->_right = cur->_right;
}
}
delete cur;
return true;
}
//右为空
else if (!cur->_right)
{
if (cur == _root)
{
_root = cur->_left;
}
else
{
//既是左为空,又是父亲的左孩子
if (parent->_right == cur)
{
parent->_right = cur->_left;
}
else
{
parent->_left = cur->_left;
}
}
delete cur;
return true;
}
//左右不为空
else
{
//replace节点是我们的替代节点
//用右子树的最左节点,或者左子树的最右节点
//这里我们使用前者
Node* replaceParent = cur;//这里不要给nullptr,就怕replaceParent不进入循环,是空
Node* replace = cur->_right;
while (replace->_left)
{
replaceParent = replace;
replace = replace->_left;
}
cur->_key = replace->_key;
if (replaceParent->_left == replace)
{
replaceParent->_left = replace->_right;
}
else
{
replaceParent->_right = replace->_right;
}
delete replace;
return true;
}
}
}
return false;
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
void _InOrder(Node* root)
{
if (root == nullptr)
{
return;
}
_InOrder(root->_left);
cout << root->_key << "-" << _root->_value << " ";
_InOrder(root->_right);
}
void Destroy(Node* root)
{
if (root == nullptr)
return;
Destroy(root->_left);
Destroy(root->_right);
delete root;
}
Node* Copy(Node* root)
{
if (root == nullptr)
return nullptr;
Node* newRoot = new Node(root->_key, root->_value);
newRoot->_left = Copy(root->_left);
newRoot->_right = Copy(root->_right);
return newRoot;
}
Node* _root = nullptr;
};
}
测试代码:
int main()
{
key_value::BSTree<string, string> dict;
//BSTree<string, string> copy = dict;
dict.Insert("left", "左边");
dict.Insert("right", "右边");
dict.Insert("insert", "插⼊");
dict.Insert("string", "字符串");
string str;
while (cin >> str)
{
auto ret = dict.Find(str);
if (ret)
{
cout << "->" << ret->_value << endl;
}
else
{
cout << "⽆此单词,请重新输⼊" << endl;
}
}
return 0;
}
int main()
{
string arr[] = { "苹果", "西⽠", "苹果", "西⽠", "苹果", "苹果", "西⽠",
"苹果", "⾹蕉", "苹果", "⾹蕉" };
key_value::BSTree<string, int> countTree;
for (const auto& str : arr)
{
// 先查找⽔果在不在搜索树中
// 1、不在,说明⽔果第⼀次出现,则插⼊<⽔果, 1>
// 2、在,则查找到的结点中⽔果对应的次数++
//BSTreeNode<string, int>* ret = countTree.Find(str);
auto ret = countTree.Find(str);
if (ret == NULL)
{
countTree.Insert(str, 1);
}
else
{
ret->_value++;
}
}
countTree.InOrder();
return 0;
}
二叉搜索树的遍历:
思想:(点击进入)
-
前序遍历(Pre-order Traversal):
- 访问顺序:根节点 -> 左子树 -> 右子树。
- 特点:在二叉搜索树中,前序遍历得到的节点序列是递增的。
-
中序遍历(In-order Traversal):
- 访问顺序:左子树 -> 根节点 -> 右子树。
- 特点:在二叉搜索树中,中序遍历可以得到节点键值的有序序列,即从小到大的顺序。
-
后序遍历(Post-order Traversal):
- 访问顺序:左子树 -> 右子树 -> 根节点。
- 特点:在二叉搜索树中,后序遍历得到的节点序列是递减的。
-
层序遍历(Level-order Traversal):
- 访问顺序:从上到下,从左到右。
- 特点:在二叉搜索树中,层序遍历得到的节点序列不一定是有序的,因为层序遍历只考虑节点的深度,不考虑键值的大小。
在二叉搜索树中,中序遍历特别有用,因为它可以以最小的成本(时间复杂度为O(n))得到一个有序的节点序列。而前序和后序遍历则常用于需要保留树结构信息的场景,如复制树或者计算树的高度等。层序遍历则常用于需要按层次处理节点的场景,如广度优先搜索(BFS)算法。