关闭

深入研究B树索引(二)

标签: database
433人阅读 评论(0) 收藏 举报

2.     B树索引的内部结构

我们可以使用如下方式将B树索引转储成树状结构的形式而呈现出来:

alter session set events 'immediate trace name treedump level INDEX_OBJECT_ID';

       比如,对于上面的例子来说,我们把创建在goodid上的名为idx_warecountd_goodid的索引转储出来。

SQL> select object_id from user_objects where object_name='IDX_WARECOUNTD_GOODID';

 OBJECT_ID

----------

      7378

SQL> alter session set events 'immediate trace name treedump level 7378';

       打开转储出来的文件以后,我们可以看到类似下面的内容:

----- begin tree dump

branch: 0x180eb0a 25225994 (0: nrow: 9, level: 2)

   branch: 0x180eca1 25226401 (-1: nrow: 405, level: 1)

      leaf: 0x180eb0b 25225995 (-1: nrow: 359 rrow: 359)

      leaf: 0x180eb0c 25225996 (0: nrow: 359 rrow: 359)

      leaf: 0x180eb0d 25225997 (1: nrow: 359 rrow: 359)

      leaf: 0x180eb0e 25225998 (2: nrow: 359 rrow: 359)

…………………

   branch: 0x180ee38 25226808 (0: nrow: 406, level: 1)

      leaf: 0x180eca0 25226400 (-1: nrow: 359 rrow: 359)

      leaf: 0x180eca2 25226402 (0: nrow: 359 rrow: 359)

      leaf: 0x180eca3 25226403 (1: nrow: 359 rrow: 359)

      leaf: 0x180eca4 25226404 (2: nrow: 359 rrow: 359)

…………………

       其中,每一行的第一列表示节点类型:branch表示分支节点(包括根节点),而leaf则表示叶子节点;第二列表示十六进制表示的节点的地址;第三列表示十进制表示的节点的地址;第四列表示相对于前一个节点的位置,根节点从0开始计算,其他分支节点和叶子节点从-1开始计算;第五列的nrow表示当前节点中所含有的索引条目的数量。比如我们可以看到根节点中含有的nrow为9,表示根节点中含有9个索引条目,分别指向9个分支节点;第六列中的level表示分支节点的层级,对于叶子节点来说level都是0。第六列中的rrow表示有效的索引条目(因为索引条目如果被删除,不会立即被清除出索引块中。所以nrow减rrow的数量就表示已经被删除的索引条目数量)的数量,比如对于第一个leaf来说,其rrow为359,也就是说该叶子节点中存放了359个可用索引条目,分别指向表warecountd的359条记录。

       上面这种方式以树状形式转储整个索引。同时,我们可以转储一个索引节点来看看其中存放了些什么。转储的方式为:

alter system dump datafile file# block block#;

       我们从上面转储结果中的第二行知道,索引的根节点的地址为25225994,因此我们先将其转换为文件号以及数据块号。

SQL> select dbms_utility.data_block_address_file(25225994),

  2  dbms_utility.data_block_address_block(25225994) from dual;

DBMS_UTILITY.DATA_BLOCK_ADDRES DBMS_UTILITY.DATA_BLOCK_ADDRES

------------------------------ ------------------------------

                             6                          60170

       于是,我们转储根节点的内容。

SQL> alter system dump datafile 6 block 60170;

       打开转储出来的跟踪文件,我们可以看到如下的索引头部的内容:

header address 85594180=0x51a1044

kdxcolev 2

KDXCOLEV Flags = - - -

kdxcolok 0

kdxcoopc 0x80: pcode=0: iot flags=--- is converted=Y

kdxconco 2

kdxcosdc 0

kdxconro 8

kdxcofbo 44=0x2c

kdxcofeo 7918=0x1eee

kdxcoavs 7874

kdxbrlmc 25226401=0x180eca1

kdxbrsno 0

kdxbrbksz 8060

       其中的kdxcolev表示索引层级号,这里由于我们转储的是根节点,所以其层级号为2。对叶子节点来说该值为0;kdxcolok表示该索引上是否正在发生修改块结构的事务;kdxcoopc表示内部操作代码;kdxconco表示索引条目中列的数量;kdxcosdc表示索引结构发生变化的数量,当你修改表里的某个索引键值时,该值增加;kdxconro表示当前索引节点中索引条目的数量,但是注意,不包括kdxbrlmc指针;kdxcofbo表示当前索引节点中可用空间的起始点相对当前块的位移量;kdxcofeo表示当前索引节点中可用空间的最尾端的相对当前块的位移量;kdxcoavs表示当前索引块中的可用空间总量,也就是用kdxcofeo减去kdxcofbo得到的。kdxbrlmc表示分支节点的地址,该分支节点存放了索引键值小于row#0(在转储文档后半部分显示)所含有的最小值的所有节点信息;kdxbrsno表示最后一个被修改的索引条目号,这里看到是0,表示该索引是新建的索引;kdxbrbksz表示可用数据块的空间大小。实际从这里已经可以看到,即便是PCTFREE设置为0,也不能用足8192字节。

       再往下可以看到如下的内容。这部分内容就是在根节点中所记录的索引条目,总共是8个条目。再加上

row#0[8043] dba: 25226808=0x180ee38

col 0; len 8; (8):  31 30 30 30 30 33 39 32

col 1; len 3; (3):  01 40 1a

……

row#7[7918] dba: 25229599=0x180f91f

col 0; len 8; (8):  31 30 30 31 31 32 30 33

col 1; len 4; (4):  01 40 8f a5

kdxbrlmc所指向的第一个分支节点,我们知道该根节点中总共存放了9个分支节点的索引条目,而这正是我们在前面所指出的为了管理3611个叶子节点,我们需要9个分支节点。

每个索引条目都指向一个分支节点。其中col 1表示所链接的分支节点的地址,该值经过一定的转换以后实际就是row#所在行的dba的值。如果根节点下没有其他的分支节点,则col 1为TERM;col 0表示该分支节点所链接的最小键值。其转换方式非常复杂,比如对于row #0来说,col 0为31 30 30 30 30 30 30 33,则将其中每对值都使用函数to_number(NN,’XX’)的方式从十六进制转换为十进制,于是我们得到转换后的值:49,48,48,48,48,48,48,51,因为我们已经知道索引键值是char类型的,所以对每个值都运用chr函数就可以得到被索引键值为:10000003。实际上,对10000003运用dump函数得到的结果就是:49,48,48,48,48,48,48,51。所以我们也就知道,10000003就是dba为25226808的索引块所链接的最小键值。

SQL> select dump('10000003') from dual;

DUMP('10000003')

-------------------------------------

Typ=96 Len=8: 49,48,48,48,48,48,48,50

       接下来,我们从根节点中随便找一个分支节点,假设就是row#0所描述的25226808。对其运用前面所介绍过的dbms_utility里的存储过程获得其文件号和数据块号,并对该数据块进行转储,其内容如下所示。可以

row#0[8043] dba: 25226402=0x180eca2

col 0; len 8; (8):  31 30 30 30 30 33 39 33

col 1; len 3; (3):  01 40 2e

………

row#404[853] dba: 25226806=0x180ee36

col 0; len 8; (8):  31 30 30 30 31 36 34 30

col 1; len 3; (3):  01 40 09

----- end of branch block dump -----

发现内容与根节点完全类似,只不过该索引块中所包含的索引条目(指向叶子节点)的数量更多了,为405个。这也与我们前面所说的一个分支索引块可以存放大约405(6488/16)个索引条目完全一致。

       然后,我们从中随便挑一个叶子节点,对其进行转储。假设就选row#0行所指向的叶子节点,根据dba的值:25226402可以知道,文件号为6,数据块号为60578。将其转储以后,其内容如下所示,我只显示与分支节点不同的部分。

………

kdxlespl 0

kdxlende 0

kdxlenxt 25226403=0x180eca3

kdxleprv 25226400=0x180eca0

kdxledsz 0

kdxlebksz 8036

       其中的kdxlespl表示当叶子节点被拆分时未提交的事务数量;kdxlende表示被删除的索引条目的数量;kdxlenxt表示当前叶子节点的下一个叶子节点的地址;kdxlprv表示当前叶子节点的上一个叶子节点的地址;kdxledsz表示可用空间,目前是0。

       转储文件中接下来的部分就是索引条目部分,每个条目包含一个ROWID,指向一个表里的数据行。如下所示。其中flag表示标记,比如删除标记等;而lock表示锁定信息。col 0表示索引键值,其算法与我们在前面介绍分支节点时所说的算法一致。col 1表示ROWID。我们同样可以看到,该叶子节点中包含了359个索引条目,与我们前面所估计的一个叶子节点中大约可以放360个索引条目也是基本一致的。

row#0[8018] flag: -----, lock: 0

col 0; len 8; (8):  31 30 30 30 30 33 39 33

col 1; len 6; (6):  01 40 2e 93 00 16

row#1[8000] flag: -----, lock: 0

col 0; len 8; (8):  31 30 30 30 30 33 39 33

col 1; len 6; (6):  01 40 2e e7 00 0e

…………

row#358[1574] flag: -----, lock: 0

col 0; len 8; (8):  31 30 30 30 30 33 39 37

col 1; len 6; (6):  01 40 18 ba 00 1f

----- end of leaf block dump -----

0
0

猜你在找
【直播】机器学习&数据挖掘7周实训--韦玮
【套餐】系统集成项目管理工程师顺利通关--徐朋
【直播】3小时掌握Docker最佳实战-徐西宁
【套餐】机器学习系列套餐(算法+实战)--唐宇迪
【直播】计算机视觉原理及实战--屈教授
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之矩阵--黄博士
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之凸优化--马博士
【套餐】Javascript 设计模式实战--曾亮
查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:295107次
    • 积分:4639
    • 等级:
    • 排名:第6267名
    • 原创:137篇
    • 转载:138篇
    • 译文:7篇
    • 评论:11条
    文章分类
    最新评论