mysql:innodb存储引擎之表结构

《Mysql技术内幕:Innodb存储引擎》

主键

每一个表都必有一个主键,这个主键可能是显式定义的(PRIMARY KEY),若没有显示定义,则将表中定义为非空唯一的索引(UNIQUE NOT NULL)设置为主键,如果这样的索引也没有,则会隐式增加一个6byte的字段并设置为主键。总结来说,表中主键按顺序为

  1. 显式设置PRIMARY KEY
  2. 显示设置UNIQUE NOT NULL
  3. 隐式增加主键

表结构

innodb的数据被放在一个空间(文件)中,这个空间被称为表空间(tablespace),而表空间由段(segment)、区(extent)、页(page)组成。

表空间结构

表空间(tablespace)

默认情况下innodb有一个共享表空间ibdata1,即所有数据都放在其中。如果启用了参数innodb_file_per_table,顾名思义,每个表都将有一个单独的表空间,但是,这个单独表空间只存放了数据、索引和插入缓冲,另外的数据、undo信息、系统事务信息等还是放在共享表空间ibdata1中。

段(segment)

如上图所示,表空间由多种类型的段组成,例如数据段、索引段、回滚段等。
innodb存储引擎表的数据是由索引组织的,数据即索引、索引即数据。众所周知,表的底层数据结构是B+树,数据段为B+数的叶子结点(leaf node segment),索引段为B+数的非叶子节点(non-leaf node segment)。

区(extent)

区由64个页组成,一页大小为16KB,每个区大小为1M
当我们启用了innodb_file_per_table,创建表的默认大小为 96KB。既然区是1M,那么表应该至少1M?其实是因为表空间优先使用32个碎片页,等碎片页用完了才会申请区。

页(page)

B+树索引只能找到记录所在的页,而不能找到具体某条记录

一页大小为16KB,也称作块,页是Innodb磁盘管理的最小单位。
常见的页类型有:

  • 数据页(B-tree Node)
  • undo页(Undo Log Page)
  • 系统页(System Page)
  • 事务数据页(Transaction system Page)
  • 插入缓冲位图页(Insert Buffer Bitmap)
  • 插入缓冲空闲列表页(Insert Buffer Free List)
  • 未压缩的二进制大对象页(Uncompressed BLOB Page)
  • 压缩的二进制大对象页(Compressed BLOB Page)

页结构

Innodb数据页由七个部分组成:

  • File Header(文件头)
  • Page Header(页头)
  • Infimum(下限) + Supremum(上限) Records
  • User Records(用户记录,即行记录)
  • Free Space(空闲空间)
  • Page Directory(页目录)
  • File Trailer(文件结尾信息)
    Innodb数据页结构
    这其中,文件头、页头、文件结尾信息大小固定,其他部分是动态的。
File Header(文件头)
  • FIL_PAGE_SPACE_OR_CHKSUM:代表该页的checksum值
  • FIL_PAGE_OFFSET:表空间中页的偏移值
  • FIL_PAGE_PREV,FIL_PAGE_NEXT:代表上一页、下一页。B+树的结构决定页是由双向链表构成的
  • FIL_PAGE_LSN:该页最后被修改的日志序列位置。LSN(Log Sequence Number)
  • FIL_PAGE_TYPE:页的类型,即上述数据页、undo页等
  • FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID:代表该页属于哪个表空间(按上述所说,innodb_file_per_table不管开没开,共享表空间中总有不同表的数据)
Page Header(页头)
  • PAGE_N_DIR_SLOTS:在Page Directory(页目录)中的slot(槽)数
  • PAGE_HEAP_TOP:堆中第一条记录的指针
  • PAGE_N_HEAP:堆中的记录数
  • PAGE_FREE:指向空闲列表的指针
  • PAGE_LAST_INSERT:最后插入记录的位置
  • PAGE_N_RECS:该页中的记录数
  • PAGE_MAX_TRX_ID:修改当前页的最大事务ID
  • PAGE_LEVEL:当前页在B-Tree(B+树)的位置
  • PAGE_INDEX_ID:当前页属于哪个索引ID
Infimum和Supremum
  • Infimum(下限):比页中所有主键都要小
  • Supremum(上限):比任何可能的主键都要大
User Records和Free Space
  • User Records:即行记录,存储每行的数据,按照B+树索引组织
  • Free Space:空闲的空间,同样是链表结构,当一个行记录被删除时,就会加入这个链表
Page Directory(页目录)

页目录中存放的是一些记录的指针,这些记录也被称作slot(槽),每个槽内有4~8条数据,上面说了,b+树只能定位到页,而查找页内的记录则是依靠这些slot,比如有(a, b, c, d, e, f, g, h, i, j)这些数据,那么假设槽内有4条记录,则页目录里的指针为(a, e, i),先通过二分查找的方式找到槽,再根据每条记录的前后指针(每条记录都是双向链表的节点)找到结果。

行(row)

Innodb存储引擎是面向行的(row-oriented),也就是说数据是以行的形式存放。
每页能存放的行数也是硬性定义的,最多存放16KB/2~200行,即7992行记录。

Compact行记录(Mysql5.0之后)

Compact行记录格式
前三个字段的意义暂且不谈,只说列数据。
值得注意的是,列数据里面的NULL值不占用任何空间,只有NULL标志位记录了第几行是NULL值。除了显式定义的列外,每行数据都有两个隐藏列事务ID列回滚指针列,若没有定义主键,还会增加6字节的RowID列用做主键。
举个栗子
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这个例子中,两个NULL值,不论是varchar还是char,都不占用空间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值