B-Tree索引与聚簇索引

最新推荐文章于 2024-07-12 18:44:29 发布

cocohao715

最新推荐文章于 2024-07-12 18:44:29 发布

阅读量847

点赞数

分类专栏： mysql

本文链接：https://blog.csdn.net/qq_36313726/article/details/82959019

版权

mysql 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

B-Tree介绍

B-Tree是一种多路搜索树（并不是二叉的）：
       1.定义任意非叶子结点最多只有M个儿子；且M>2；
       2.根结点的儿子数为[2, M]；
       3.除根结点以外的非叶子结点的儿子数为[M/2, M]；
       4.每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字）
       5.非叶子结点的关键字个数=指向儿子的指针个数-1；
       6.非叶子结点的关键字：K[1], K[2], …, K[M-1]；且K[i] < K[i+1]；
       7.非叶子结点的指针：P[1], P[2], …, P[M]；其中P[1]指向关键字小于K[1]的子树，P[M]指向关键字大于K[M-1]的子树，其它P[i]指向关键字属于(K[i-1], K[i])的子树；
       8.所有叶子结点位于同一层；
       如：（M=3）

B-树的特性：
       1.关键字集合分布在整颗树中；
       2.任何一个关键字出现且只出现在一个结点中；
       3.搜索有可能在非叶子结点结束；
       4.其搜索性能等价于在关键字全集内做一次二分查找；
       5.自动层次控制；

B-树的搜索，从根结点开始，对结点内的关键字（有序）序列进行二分查找，如果命中则结束，否则进入查询关键字所属范围的儿子结点；重复，直到所对应的儿子指针为空，或已经是叶子结点；

B+Tree介绍

B+树是B-树的变体，也是一种多路搜索树：

1.其定义基本与B-树同，除了：

2.非叶子结点的子树指针与关键字个数相同；

3.非叶子结点的子树指针P[i]，指向关键字值属于[K[i], K[i+1])的子树（B-树是开区间）；

5.为所有叶子结点增加一个链指针；

6.所有关键字都在叶子结点出现；

如：（M=3）

B+的搜索与B-树也基本相同，区别是B+树只有达到叶子结点才命中（B-树可以在非叶子结点命中），其性能也等价于在关键字全集做一次二分查找；

B+的特性：

1.所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好是有序的；

2.不可能在非叶子结点命中；

3.非叶子结点相当于是叶子结点的索引（稀疏索引），叶子结点相当于是存储（关键字）数据的数据层；

4.更适合文件索引系统；

聚簇索引

索引和数据存储在一块（都存储在同一个B*tree 中）。
一般主键索引都是聚餐索引

Mysql中InnoDB引擎的主键索引为聚簇索引，MyISAM存储引擎采用非聚集索引

非聚簇索引

索引数据和存储数据是分离的。（就是下面说的二级索引）

二级索引（辅助索引）

二级索引存储的是记录的主键，而不是数据存储的地址。

以Mysql的InnoDB为例
主键是聚集索引
唯一索引、普通索引、前缀索引等都是二级索引（辅助索引）

示例

下面我们通过一个具体的示例进行演示聚集索引和二级索引

pl_ranking（编程语言排行榜表）

该表包含3个字段，如下：
id:主键
plname：编程语言名称
ranking：排名

id	plname	ranking
15	C	2
16	Java	1
18	Php	6
23	C#	5
26	C++	3
29	Ada	17
50	Go	12
52	Lisp	15
…	…	…

id: 设置主键
plname: 普通索引

聚簇索引(主键索引)

聚集索引
从图中我们可以看到，索引数据和存储数据都是在一颗树上，存在一起的。通过定位索引就直接可以查找到数据。

这棵树是根据主键进行创建的。
如果查找id=16的编程语言，
select id, plname, ranking from pl_ranking where id=16;
则只需要读取3个磁盘块，就可以获取到数据。

二级索引（辅助索引）

从上图中我们发现，该B*tree根据plname列进行构建的，只存储索引数据，plname 和 id 的映射。

比如查找编程语言为“Java”的数据。
select id, plname, ranking from pl_ranking where plname=’Java’;
首先通过二级索引树中找到 Java 对应的主键id 为 “16”（读取2个磁盘块）。
然后在去主键索引中查找id为“16” 的数据。（读取3个磁盘块）

结论

select id, plname, ranking from pl_ranking where id=16;
根据主键查找只需要查找3个磁盘块
select id, plname, ranking from pl_ranking where plname=’Java’;
根据编程语言名称查询需要读取5个磁盘块

结论一

通过上面的主键索引和非主键索引的例子我们可以得出：
主键索引（聚餐索引）查询效率比非主键索引查询效率更高。如果能使用主键查找的，就尽量使用主键索引进行查找。

结论二

从上面图中我们还可以分析得出以下结论：
主键定义的长度越小，二级索引的大小就越小，这样每个磁盘块存储的索引数据越多，查询效率就越高。

cocohao715

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
B-Tree索引与聚簇索引

B-Tree介绍B-Tree是一种多路搜索树（并不是二叉的）： 1.定义任意非叶子结点最多只有M个儿子；且M&gt;2； 2.根结点的儿子数为[2, M]； 3.除根结点以外的非叶子结点的儿子数为[M/2, M]； 4.每个结点存放至少M/2-1（取上整）和至多M-1个关键字；（至少2个关键字） 5.非叶子结点的关键字个数=...
复制链接

扫一扫

专栏目录