mysql存储的最小单元是页
一 . 页的结构
1.页头
记录页面控制信息,占用56个字节,包括页左右兄弟页,页面指针,页面空间使用情况,页和页之间使用双向链表进行连接;
2.虚记录
- 最大虚记录:比页内最大主键大;
- 最小虚记录:比页内最小主键小;
3.记录堆
行记录存储区
- 有效记录
- 已经删除记录
4.自由空间链表
已经删除的记录组成的链表
5.未分配的空间
页面未使用的存储空间
6.页尾
页面的最后部分,占用8个字节,主要存储页面校验信息
二 . 页内记录的维护
1. 页内数据记录存储结构
如果要保证数据的有序有两种方式
- 物理有序(磁盘的有序插入)类似数组
- 插入:需要移动,性能低
- 查询:位置有序,看起来可以使用二分查找,性能高
- 逻辑有序 类似链表
- 插入:无需移动,性能高
- 查询:遍历查询,性能低
如果使用物理有序,插入记录的低效是不可避免的,所有MySQL选用了逻辑有序进行保存数据,查询低效可以进行优化
2.插入策略
页内的数据记录可插入空间包括自由空间链表和未使用空间 ,InnoDB优先使用自由空间链表;
频繁使用插入和删除的表,会产生空间碎片,要定期做空间收缩处理
3.页内查询
如果是物理连续存储,能不能使用二分查询?
二分的前提是数据一样大,无法按照记录的size()做偏移,所以记录使用物理连续,二分查询页未必能用;
mysql 为了解决链表查询效率的问题,引如了槽(slot)解决方案,查询时候先从槽入手,由于槽是连续分布的结构,可以使用二分查询,效率高,再查询槽对应的一段链表数据,这样就可以有效的增加查询效率;