目录
二叉树在前面C数据结构阶段已经讲过,本节取名二叉树进阶是因为:
1. map和set特性需要先铺垫二叉搜索树,而二叉搜索树也是一种树形结构
2. 二叉搜索树的特性了解,有助于更好的理解map和set的特性
3. 二叉树中部分面试题稍微有点难度,在前面讲解大家不容易接受,且时间长容易忘。
4. 有些OJ题使用C语言方式实现比较麻烦,比如有些地方要返回动态开辟的二维数组,非常麻烦。
1.二叉搜索树
1.1概念
二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树:
- 若它的左子树不为空,则左子树上所有节点的值都小于根节点的值
- 若它的右子树不为空,则右子树上所有节点的值都大于根节点的值
- 它的左右子树也分别为二叉搜索树
1.2二叉搜索树的操作
1. 二叉搜索树的查找
a、从根开始比较,查找,比根大则往右边走查找,比根小则往左边走查找。
b、最多查找高度次,走到到空,还没找到,这个值不存在。
二叉树搜索查找代码(Find)
Node* Find(const k& key)
{
Node* cur = _root;
while (cur)
{
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return cur;
}
return nullptr;
}
2. 二叉搜索树的插入
a. 树为空,则直接新增节点,赋值给root指针
b. 树不空,按二叉搜索树性质查找插入位置,插入新节点
二叉搜索树的插入代码(Insert)
bool Insert(const k& key, const v& value)
{
if (_root == nullptr)
{
_root = new Node(key,value);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
parent = cur;
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return false;
cur = new Node(key,value);
if (parent->val > key)
{
parent->left = cur;
}
else
{
parent->right = cur;
}
}
return true;
}
3.二叉搜索树的删除
首先查找元素是否在二叉搜索树中,如果不存在,则返回, 否则要删除的结点可能分下面四种情 况:
- 要删除的结点无孩子结点
- 要删除的结点只有左孩子结点
- 要删除的结点只有右孩子结点
- 要删除的结点有左、右孩子结点
看起来有待删除节点有4中情况,实际情况a可以与情况b或者c合并起来,因此真正的删除过程 如下:
- 情况b:删除该结点且使被删除节点的双亲结点指向被删除节点的左孩子结点--直接删除
- 情况c:删除该结点且使被删除节点的双亲结点指向被删除结点的右孩子结点--直接删除
- 情况d:在它的右子树中寻找中序下的第一个结点(关键码最小),用它的值填补到被删除节点中,再来处理该结点的删除问题--替换法删除
替换法:找其左子树中的最大节点,即左子树中最右侧的节点,或者在其右子树中最小的节 点,即右子树中最小的节点 替代节点找到后,将替代节点中的值交给待删除节点,转换成删除替代节点
二叉搜索数删除代码(Earse)
bool Erase(const T& data)
{
如果树为空,删除失败
if (nullptr == _pRoot)
return false;
查找在data在树中的位置
PNode pCur = _pRoot;
PNode pParent = nullptr;
while (pCur)
{
if (data == pCur->_data)
break;
else if (data < pCur->_data)
{
pParent = pCur;
pCur = pCur->_pLeft;
}
else
{
pParent = pCur;
pCur = pCur->_pRight;
}
}
data不在二叉搜索树中,无法删除
if (nullptr == pCur)
return false;
分以下情况进行删除,同学们自己画图分析完成
if (nullptr == pCur->_pRight)
{
当前节点只有左孩子或者左孩子为空---可直接删除
}
else if (nullptr == pCur->_pRight)
{
当前节点只有右孩子---可直接删除
}
else
{
当前节点左右孩子都存在,直接删除不好删除,可以在其子树中找一个替代结点,
比如:
找其左子树中的最大节点,即左子树中最右侧的节点,或者在其右子树中最小的节点,即右子树中最小的节点
替代节点找到后,将替代节点中的值交给待删除节点,转换成删除替代节点
}
return true;
}
全部代码
#include <iostream>
using namespace std;
#include <utility>
template <class k,class v>
struct BSTreeNode
{
BSTreeNode* left;
BSTreeNode* right;
k val;
v value;
BSTreeNode(const k& key, const v& value)
:left(nullptr)
,right(nullptr)
,val(key)
,value(value)
{}
};
template <class k,class v>
class BSTree
{
typedef BSTreeNode<k,v> Node;
public:
bool Insert(const k& key, const v& value)
{
if (_root == nullptr)
{
_root = new Node(key,value);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
parent = cur;
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return false;
cur = new Node(key,value);
if (parent->val > key)
{
parent->left = cur;
}
else
{
parent->right = cur;
}
}
return true;
}
Node* Find(const k& key)
{
Node* cur = _root;
while (cur)
{
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return cur;
}
return nullptr;
}
bool Erase(const k& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->val < key)
{
parent = cur;
cur = cur->right;
}
else if (cur->val > key)
{
parent = cur;
cur = cur->left;
}
else
{
/* 1.左为空
2.右为空
3.左右都不为空*/
if (cur->left == nullptr)
{
if (parent == nullptr)
{
_root = cur->right;
}
else
{
if (cur == parent->left)
parent->left = cur->right;
else
parent->right = cur->right;
}
delete cur;
}
else if (cur->right == nullptr)
{
if (parent == nullptr)
{
_root = cur->left;
}
else
{
if (cur == parent->left)
parent->left = cur->left;
else
parent->right = cur->left;
}
delete cur;
}
else
{
Node* parent = cur;
Node* subleft = cur->right;
while (subleft->left)
{
parent = subleft;
subleft = subleft->right;
}
swap(cur->val, subleft->val);
if (subleft == parent->left)
parent->left = subleft->right;
else
parent->right = subleft->right;
delete subleft;
}
return true;
}
}
return false;
}
void _InOrder(Node* root)
{
{
if (root == nullptr)
return;
_InOrder(root->left);
cout << root->val << ":" << root->value << endl;
_InOrder(root->right);
}
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
Node* _root = nullptr;
};
1.3 二叉搜索树的应用
1. K模型:K模型即只有key作为关键码,结构中只需要存储Key即可,关键码即为需要搜索到的值。
比如:给一个单词word,判断该单词是否拼写正确,具体方式如下:
- 以词库中所有单词集合中的每个单词作为key,构建一棵二叉搜索树
- 在二叉搜索树中检索该单词是否存在,存在则拼写正确,不存在则拼写错误。
2. KV模型:每一个关键码key,都有与之对应的值Value,即的键值对。该种方式在现实生活中非常常见:
- 比如英汉词典就是英文与中文的对应关系,通过英文可以快速找到与其对应的中文,英 文单词与其对应的中文就构成一种键值对;
- 再比如统计单词次数,统计成功后,给定单词就可快速找到其出现的次数,单词与其出 现次数就是就构成一种键值对。
#include <iostream>
using namespace std;
#include <utility>
template <class k,class v>
struct BSTreeNode
{
BSTreeNode* left;
BSTreeNode* right;
k val;
v value;
BSTreeNode(const k& key, const v& value)
:left(nullptr)
,right(nullptr)
,val(key)
,value(value)
{}
};
template <class k,class v>
class BSTree
{
typedef BSTreeNode<k,v> Node;
public:
bool Insert(const k& key, const v& value)
{
if (_root == nullptr)
{
_root = new Node(key,value);
return true;
}
Node* cur = _root;
Node* parent = nullptr;
while (cur)
{
parent = cur;
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return false;
cur = new Node(key,value);
if (parent->val > key)
{
parent->left = cur;
}
else
{
parent->right = cur;
}
}
return true;
}
Node* Find(const k& key)
{
Node* cur = _root;
while (cur)
{
if (cur->val > key)
{
cur = cur->left;
}
else if (cur->val < key)
{
cur = cur->right;
}
else
return cur;
}
return nullptr;
}
bool Erase(const k& key)
{
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->val < key)
{
parent = cur;
cur = cur->right;
}
else if (cur->val > key)
{
parent = cur;
cur = cur->left;
}
else
{
/* 1.左为空
2.右为空
3.左右都不为空*/
if (cur->left == nullptr)
{
if (parent == nullptr)
{
_root = cur->right;
}
else
{
if (cur == parent->left)
parent->left = cur->right;
else
parent->right = cur->right;
}
delete cur;
}
else if (cur->right == nullptr)
{
if (parent == nullptr)
{
_root = cur->left;
}
else
{
if (cur == parent->left)
parent->left = cur->left;
else
parent->right = cur->left;
}
delete cur;
}
else
{
Node* parent = cur;
Node* subleft = cur->right;
while (subleft->left)
{
parent = subleft;
subleft = subleft->right;
}
swap(cur->val, subleft->val);
if (subleft == parent->left)
parent->left = subleft->right;
else
parent->right = subleft->right;
delete subleft;
}
return true;
}
}
return false;
}
void _InOrder(Node* root)
{
{
if (root == nullptr)
return;
_InOrder(root->left);
cout << root->val << ":" << root->value << endl;
_InOrder(root->right);
}
}
void InOrder()
{
_InOrder(_root);
cout << endl;
}
private:
Node* _root = nullptr;
};
void TestBSTree()
{
BSTree<string, string> dict;
dict.Insert("insert", "插入");
dict.Insert("erase", "删除");
dict.Insert("left", "左边");
dict.Insert("string", "字符串");
string str;
while (cin >> str)
{
auto ret = dict.Find(str);
if (ret)
{
cout << str << ":" << ret->value << endl;
}
else
{
cout << "单词拼写错误" << endl;
}
}
string strs[] = { "苹果", "西瓜", "苹果", "樱桃", "苹果", "樱桃", "苹果", "樱桃", "苹果" };
// 统计水果出现的次
BSTree<string, int> countTree;
for (auto str : strs)
{
auto ret = countTree.Find(str);
if (ret == NULL)
{
countTree.Insert(str, 1);
}
else
{
ret->value++;
}
}
countTree.InOrder();
}
int main()
{
TestBSTree();
return 0;
}
1.4 二叉搜索树的性能分析
插入和删除操作都必须先查找,查找效率代表了二叉搜索树中各个操作的性能。
对有n个结点的二叉搜索树,若每个元素查找的概率相等,则二叉搜索树平均查找长度是结点在二 叉搜索树的深度的函数,即结点越深,则比较次数越多。
但对于同一个关键码集合,如果各关键码插入的次序不同,可能得到不同结构的二叉搜索树:
如果二叉排序树是平衡的,则n个节点的二叉排序树的高度为,其查找效率为,近似于折半查找。
如果二叉排序树完全不平衡,则其深度可达到n,查找效率为O(n),退化为顺序查找。
一般的,二叉排序树的查找性能在到O(n)之间
问题:如果退化成单支树,二叉搜索树的性能就失去了。那能否进行改进,不论按照什么次序插 入关键码,二叉搜索树的性能都能达到最优?那么我们后续章节学习的AVL树和红黑树就可以上场了。