sql写入的总结
- 执行前记录到undolog
- 数据写入到内存buffer pool
- buffer pool修改时记录redo log buffer
- redo log buffer写入到redo log中
- redolog写入时进行binlog刷盘操作
- 完成刷盘操作后告知redolog,redolog打commit标记
- 小部分io线程将buffer pool写入到ibd文件
mysql存储结构
建表后会在data目录下生成
frm文件存储表结构
ibd文件存储数据和索引
ibd在5.7版本之后才会为每张表生成独立的ibd文件,即独立表空间;
页是innodb中内存与硬盘交互的最小存储单元,所以在磁盘中每个页都是连续的;
我们经常查询的数据大都连续存在,基于此只需在磁盘中读取连续的数据放入内存,减少磁盘访问次数,这样提高了查询效率,固定的连续数据被称为页;
这一段固定的连续数据大小为16kb,即使没有数据也会占用16kb;
页的结构
- 页头
- 数据行
- 页尾
数据行最大不超过8kb
mysql所有的数据都会通过页和行机制来存储;
读取读取量大时,跨页读取数据
物理层面,磁头会移动,相较于磁道的移动,性能大大的降低;
应该尽可能在磁道上读取连续数据;
解决方法
提供了区结构,区存储连续的64页,这样的话,跨页读取大概率会在附近,提高效率,如果频繁的读取某个页,将整个区都加载到内存buffer pool减少后续查询对磁盘的访问次数;
我们在新建表时,不知道存储的数据级别,默认初始6个页,而不是一个完整的区;8.0版本之后初次创建7个页;
这些页会被放在表空间的碎片区,
前4页分别记录
- 表空间和区组条目信息
- change buffer相关信息
- 段信息
- 索引跟信息
源码中有提到这些
当页申请增加到32页,后续都会申请完整的区
为了有效的管理区,又有了组结构
一组管理256个区共256mb
段
区组是物理结构,段是逻辑结构,并不对应连续区域;
非叶子节点段和叶子结点段构成了ibd文件
总结
逻辑段管理页和区结构(页和区均为物理结构)构成ibd文件
组管理256个区
区管理64页
页在表新建时初始为6页,申请到32页后申请完整的区;
页就是每张表的独立表空间