MySQL 支持多种存储引擎,不同的存储引擎,存储数据的方式也是不同的,我们最常使用的是 InnoDB 存储引擎,所以就跟大家图解下InnoDB 是如何存储数据的。
记录是按照行来存储的,但是数据库的读取并不以「行」为单位,否则一次读取(也就是一次 I/O 操作)只能处理一行数据,效率会非常低。
因此,InnoDB 的数据是按「数据页」为单位来读写的,也就是说,当需要读一条记录的时候,并不是将这个记录本身从磁盘读出来,而是以页为单位,将其整体读入内存。
数据库的 I/O 操作的最小单位是页,InnoDB 数据页的默认大小是 16KB,意味着数据库每次读写都是以 16KB 为单位的,一次最少从磁盘中读取 16K 的内容到内存中,一次最少把内存中的 16K 内容刷新到磁盘中。
数据页包括七个部分,结构如下图:
整体概览图
现在有这么一个问题,innodb引擎的表,假设一行数据为1kb,主键ID为bigint型,一颗高度为4的b+树能存储多少数据?
我们知道,innodb中一个页的大小默认是16kb,首先我们要假设一页里面只有User Records,或者说只存放主键和指针/数据,那么由于非叶子节点只存放主键和指针,首先根节点可以存放16k个byte/(主键8byte+指针6byte),就是161024/14=1170个主键加指针组合,4层树高就是1170的3次方就是16亿个指针,一个叶子节点可以存放16行数据,所以总行数等于16亿乘以16=25,625,808,000,256亿行,三层是2000万,两层是117016=18720行,可以看到B+树的高散出性是非常夸张的,从两层的18720,三层的2000万,四层256亿。