B-tree检索技术的算法

最新推荐文章于 2024-09-14 20:03:08 发布

angelatan

最新推荐文章于 2024-09-14 20:03:08 发布

阅读量689

点赞数

文章标签：算法存储系统优化扩展存储

本文链接：https://blog.csdn.net/angelatan2012/article/details/7597015

版权

B-tree检索技术的算法

这里先简单的介绍一下搜索算法，搜索算法是利用计算机的高性能来有目的的穷举一个问题的部分或者全部可能情况，从而求出问题的一种方法。搜索过程实际上是根据初始条件和预期目的构造一棵解答树并寻找预期目标状态的节点的过程。所有的搜索算法从其最终的实现上来看，都可以划分为两个部分控制结构和产生系统，而所有的算法优化就是通过优化控制结构完成的。

这里只与一种比较常见的检索技术HASH做一下对比。B-tree相对于普通的有序树，它有两个优点：一是它的复杂度天然就是严格O(logn)，不像普通的二叉树，可能退化成O(N)的，也不像平衡二叉树（AVL）一样得写得很辛苦才可以平衡；二是利用了存储系统的特点，B-tree是有序的，而且是基于比较有序的，所以它的复杂度不可能低于O(logn)，所以比较的次数不会比别的树少，但是它利用了存储系统一次读大块数据比多次读小量数据要快的特点，一个节点有M个儿子，这M个儿子可以连续存储，也可以一次读进来，所以B-tree调优很重要一点就是根据硬件的特点，选择M。对于一些简单的检索使用Hash比较方便。但当检索海量文件时，它的性能就体现出来了：