数据结构——B树

一、B树的特点

B树也叫多路平衡查找树,它有如下特点:

  1. 每个结点最多有m-1个关键字(m指阶数,阶代表B树中所有节点的孩子个树的最大值),至少有m棵子树;
  2. 根节点最少可以只有1个关键字(若根节点为非终端结点,最少有两棵子树);
  3. 非根节点至少有⌈m/2⌉-1个关键字;
  4. 每个结点中的关键字都按照从小到大的顺序排列,每个关键字的左子树中的所有关键字都小于它,而右子树中的所有关键字都大于它;
  5. 所有叶子节点都位于同一层,并且不携带信息(即绝对平衡);
  6. 每个节点都存有索引和数据,也就是对应的key和value。
关键字数量范围:根节点:1~m-1;非叶节点:⌈m/2⌉-1~m-1

二、B树的查找

B树查找包含两个基本操作:

  1. 在B树中找节点;
  2. 在结点中找关键字。

B树的查找和二叉排序树很相似,可以看作是二叉排序树的扩展,二叉排序树是二路查找,B树是多路查找,因为B树结点内的关键字是有序的,在结点内进行查找时除了顺序查找外,还可以用折半查找来提升效率。B树的具体查找步骤如下(假设查找的关键字为key):

  • 从根结点开始,在结点包含的关键码中查找给定的关键码,找到则查找成功;
  • 否则确定给定关键码可能在的子树,重复上面的操作,直到查找成功或者指针为空为止。

三、B树的插入

规则
判断当前结点key的个数是否小于等于m-1,

  • 若满足,则直接插入;
  • 若不满足,将结点的中间的key将这个结点分为左右两部分,中间的结点放到父节点中。

举例

在5阶B树中,结点最多有4个key,最少有2个key

(1) 插入18,70,50,40

(2) 插入22
在这里插入图片描述

因为B树的阶为5,所以每个节点的key最多只有4个,而此时插入22之后根节点中有5个key,因此需要进行分裂:

(3) 插入23,25,39

插入的3个数据都比根节点40要大,因此都插入到左节点当中:
在这里插入图片描述
插入结点之后,左节点中的关键字已经超过了最大能包含的关键字数,因此需要进行分裂,将23放到父节点当中:
在这里插入图片描述

四、B树的删除

  1. 当被删的关键字k不在终端节点时(最底层的非叶结点)中时,用k的前驱(或后继)k’来替代k,然后在相应的结点中删除k’,关键字k’必定落在某个终端节点中,则转换成了被删关键字在终端节点中的情形。

  2. 当被删关键字在终端结点中时,有三种情况:

    (1) 直接删除关键字。若被删关键字所在结点的关键字个数>=⌈m/2⌉,表明删除该关键字之后仍然满足B树的定义,则直接删去该关键字。

    (2) 兄弟够借。若被删关键字所在结点删除前的关键字个数=⌈m/2⌉-1,且与该节点相邻的右(或左)兄弟结点的关键字个数>=⌈m/2⌉,则需要调整该节点、右(或左)兄弟结点及其双亲结点(父子换位法),以达到新的平衡。

    (3) 兄弟不够借。若被删关键字所在结点删除前的关键字个数=⌈m/2⌉-1,且此时与该节点相邻的右、左兄弟结点的关键字个数均=⌈m/2⌉-1,则将关键字删除后与左(或右)兄弟结点即双亲结点中的关键字进行合并。

    在合并过程中,双亲结点的关键字个数会减1。若其双亲结点是根节点且关键字个数减少至0(根节点关键字个数为1时,有2棵子树),则直接将根节点删除,合并后的新节点成为根节点;若双亲结点不是根节点,且关键字个数减少到⌈m/2⌉-2,则又要与他自己的兄弟节点进行调整或合并操作,并重复上述步骤,直至符合B树的要求为止。

举例:下面是一棵5阶B树,则非根节点关键字个数范围为:2~4
在这里插入图片描述

(1)删除21,此时删除的是终端节点关键字,删除之后结点关键字数为2,大于>=⌈m/2⌉-1,可以直接删除:(紫色代表被删除的元素)
在这里插入图片描述
(2)删除27,此时删除的结点为非终端节点关键字,需要用他的前驱或者后继元素覆盖要删除的关键字(这里选择的是后继元素28),然后在后继关键字所在的分支中将该后继关键字删除。
在这里插入图片描述
但是删除27之后,后继关键字所在的分支只留下29一个关键字,关键字的个数<⌈m/2⌉-1,而他的左兄弟结点元素个数>=⌈m/2⌉,则先将父节点的元素移到该节点,再将兄弟节点的元素移动到父节点:
在这里插入图片描述

(3)删除32,删除的为终端节点关键字,删除32之后其所在的结点关键字个数<⌈m/2⌉-1,并且他的兄弟节点没有多余的元素可以借。首先将父节点的元素移到该节点,然后将当前节点与兄弟节点合并,形成新节点。
在这里插入图片描述

将当前结点与兄弟节点合并:
在这里插入图片描述
(4)删除40,删除的为终端节点关键字,删除40之后其所在的结点关键字个数<⌈m/2⌉-1,并且他的兄弟节点没有多余的元素可以借。首先将父节点的元素移到该节点,然后将当前节点与兄弟节点合并,形成新节点。
在这里插入图片描述

与兄弟结点合并:
在这里插入图片描述

而父节点此时并不满足条件,且它的兄弟并没有多余的关键字可以给他,因此将父节点的父节点中的关键字移动到父节点当中,并且和兄弟节点合并:
在这里插入图片描述
此时父节点的父节点关键字个数减少至0,则直接将父节点的父节点删除,合并后的父节点成为根节点。

五、B树的使用场景40

用作文件系统的索引。

六、B树的优点

B树和二叉树、红黑树相比,子树更多,树的高度更低,搜索效率更高。若子树太多就可能变成一个有序数组,所以不能无限增加子树数量,因为文件系统和数据库一般都是存在电脑硬盘上的,若数据量太大不一定能一次性加载到内存中,但是B树可以多路存储,因此在文件查找时每次只加载一个结点的内容存入内存来查找,而红黑树在内存中查找非常快,但是在数据库和文件系统中,B树更优。

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
哈夫曼编码是一种常用的数据压缩算法,可以将原始数据转换为更短的编码,从而减少存储空间。它的基本思想是:根据字符出现的频率,构建一颗二叉树,使得出现频率高的字符离根节点近,出现频率低的字符离根节点远。然后,对于每个字符,从根节点出发,沿着对应的路径到达该字符所在的叶子节点,记录下路径,作为该字符的编码。 哈夫曼编码的具体实现步骤如下: 1. 统计每个字符在原始数据中出现的频率。 2. 根据字符的频率构建哈夫曼树。构建方法可以采用贪心策略,每次选择出现频率最低的两个字符,将它们作为左右子节点,父节点的权值为两个子节点的权值之和。重复这个过程,直到只剩下一个根节点。 3. 对哈夫曼树进行遍历,记录下每个字符的编码,为了避免编码产生歧义,通常规定左子节点为0,右子节点为1。 4. 将原始数据中的每个字符,用它对应的编码来代替。这一步可以通过哈夫曼树来实现。 5. 将编码后的数据存储起来。此时,由于每个字符的编码长度不同,所以压缩后的数据长度也不同,但总体上来说,压缩效果通常是比较好的。 实现哈夫曼编码的关键在于构建哈夫曼树和计算每个字符的编码。构建哈夫曼树可以采用优先队列来实现,每次从队列中取出两个权值最小的节点,合并成一个节点,再将合并后的节点插入队列中。计算每个字符的编码可以采用递归遍历哈夫曼树的方式,从根节点出发,如果走到了左子节点,则将0添加到编码中,如果走到了右子节点,则将1添加到编码中,直到走到叶子节点为止。 以下是基于C++的代码实现,供参考: ```c++ #include <iostream> #include <queue> #include <string> #include <unordered_map> using namespace std; // 定义哈夫曼树节点的结构体 struct Node { char ch; // 字符 int freq; // 出现频率 Node* left; // 左子节点 Node* right; // 右子节点 Node(char c, int f) : ch(c), freq(f), left(nullptr), right(nullptr) {} }; // 定义哈夫曼树节点的比较函数,用于优先队列的排序 struct cmp { bool operator() (Node* a, Node* b) { return a->freq > b->freq; } }; // 构建哈夫曼树的函数 Node* buildHuffmanTree(unordered_map<char, int> freq) { priority_queue<Node*, vector<Node*>, cmp> pq; for (auto p : freq) { pq.push(new Node(p.first, p.second)); } while (pq.size() > 1) { Node* left = pq.top(); pq.pop(); Node* right = pq.top(); pq.pop(); Node* parent = new Node('$', left->freq + right->freq); parent->left = left; parent->right = right; pq.push(parent); } return pq.top(); } // 遍历哈夫曼树,计算每个字符的编码 void calcHuffmanCode(Node* root, unordered_map<char, string>& code, string cur) { if (!root) return; if (root->ch != '$') { code[root->ch] = cur; } calcHuffmanCode(root->left, code, cur + "0"); calcHuffmanCode(root->right, code, cur + "1"); } // 将原始数据编码成哈夫曼编码 string encode(string s, unordered_map<char, string> code) { string res; for (char c : s) { res += code[c]; } return res; } // 将哈夫曼编码解码成原始数据 string decode(string s, Node* root) { string res; Node* cur = root; for (char c : s) { if (c == '0') { cur = cur->left; } else { cur = cur->right; } if (!cur->left && !cur->right) { res += cur->ch; cur = root; } } return res; } int main() { string s = "abacabad"; unordered_map<char, int> freq; for (char c : s) { freq[c]++; } Node* root = buildHuffmanTree(freq); unordered_map<char, string> code; calcHuffmanCode(root, code, ""); string encoded = encode(s, code); string decoded = decode(encoded, root); cout << "Original string: " << s << endl; cout << "Encoded string: " << encoded << endl; cout << "Decoded string: " << decoded << endl; return 0; } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值