### 准备工作
首先,为了说明方便,本文使用了 [innoisp](https://github.com/sryanyuan/innoisp) 来解析ibd文件来获取各个page的信息。
ibd文件为innodb的存储文件,存储着各种数据,比如行数据、undolog、insert buffer等。
在任意情况下,会存在系统ibd文件,所有的库表数据都会在其中。用户也可以选择将表给分离开来,使用一个表一个ibd的方式进行存储。
假设读者已经熟悉ibd的基础知识,包括但不限于page的划分,以及各种page的用途,本文仅仅记录怎样通过解析ibd文件来寻找到某一行数据。
首先,我们需要确定主键类型,由于ibd文件没有表结构信息,所以我们需要知道主键类型来确定主键存储所需要的字节数。同时我们需要确定我们通过的是主键还是通过其余的索引来查找记录,在这里我们仅仅讨论使用primary key来查找记录的情形。
上述准备好后,我们就可以通过解析ibd文件来查找所需要的行数据了。假设我们要查找的key为2,下面来分步骤来解析:
### 确定根索引页 (Root index page)
根索引页用于定位到B+ tree的根节点来进行快速查找,为了得到root index page的页码,我们需要通过解析file segment inode页。
file segment inode实际上是一个将ibd文件再次分割成逻辑文件的管理结构。在一个table的ibd文件中,假设该表只有一个主键,则会有2个inode,分别是索引的inode和数据的inode。inode通过引用extend来划分extend。
所以我们只需要读取inode序号为1的所有的extend和fragment array信息即可。
我们使用innoisp来读取inode信息,可以得到如下的输出:
==========PAGE 2 OFFSET 0x8000==========
page list
0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000
file segment id used(nf) free list not_full list full list fragment array
0x00000032:1 0 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 3 36 37 (page allocate)
0x000000F2:2 36 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<1> 0x00000000:0x047E 0x00000000:0x047E len<24> 0x00000000:0x00BE 0x00000000:0x0456 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2
首先,为了说明方便,本文使用了 [innoisp](https://github.com/sryanyuan/innoisp) 来解析ibd文件来获取各个page的信息。
ibd文件为innodb的存储文件,存储着各种数据,比如行数据、undolog、insert buffer等。
在任意情况下,会存在系统ibd文件,所有的库表数据都会在其中。用户也可以选择将表给分离开来,使用一个表一个ibd的方式进行存储。
假设读者已经熟悉ibd的基础知识,包括但不限于page的划分,以及各种page的用途,本文仅仅记录怎样通过解析ibd文件来寻找到某一行数据。
首先,我们需要确定主键类型,由于ibd文件没有表结构信息,所以我们需要知道主键类型来确定主键存储所需要的字节数。同时我们需要确定我们通过的是主键还是通过其余的索引来查找记录,在这里我们仅仅讨论使用primary key来查找记录的情形。
上述准备好后,我们就可以通过解析ibd文件来查找所需要的行数据了。假设我们要查找的key为2,下面来分步骤来解析:
### 确定根索引页 (Root index page)
根索引页用于定位到B+ tree的根节点来进行快速查找,为了得到root index page的页码,我们需要通过解析file segment inode页。
file segment inode实际上是一个将ibd文件再次分割成逻辑文件的管理结构。在一个table的ibd文件中,假设该表只有一个主键,则会有2个inode,分别是索引的inode和数据的inode。inode通过引用extend来划分extend。
所以我们只需要读取inode序号为1的所有的extend和fragment array信息即可。
我们使用innoisp来读取inode信息,可以得到如下的输出:
==========PAGE 2 OFFSET 0x8000==========
page list
0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000
file segment id used(nf) free list not_full list full list fragment array
0x00000032:1 0 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 3 36 37 (page allocate)
0x000000F2:2 36 len<0> 0xFFFFFFFF:0x0000 0xFFFFFFFF:0x0000 len<1> 0x00000000:0x047E 0x00000000:0x047E len<24> 0x00000000:0x00BE 0x00000000:0x0456 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 2