MySQL组件和数据结构

1、MySQL组件

连接器

  • 由一个工作线程去从一个网络连接中读取SQL语句
  • IO模型:IO多路复用。扩展:网络IO模型

解析器

  • 查询解析器(Parser):对SQL语句进行拆分解析
  • 查询优化器:生成执行计划,选择最优的查询路径

ps:常用sql性能定位工具

  • explain sql

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kqc1CwKE-1608172012619)(C:\Users\stanley.wang\AppData\Roaming\Typora\typora-user-images\image-20201216111830183.png)]

  • optimizer_trace

执行器

  • 执行器根据执行计划调用存储引擎的接口在这里插入图片描述

2、innodb 数据结构

表空间(tablespace)

  • 系统表空间

  • 表文件表空间

  • 共享表空间

  • 临时表空间

  • undo表空间(5.7已弃用)

段(segment) -> 区(extent) -> 页(page) -> 行(row)

  • 段的管理都是有存储引擎自身完成的。

  • 区是最小申请单位(一般申请4个),页是I/O操作的最小对象,行是data的最小单位。

  • 单个区上物理空间是连续的,不同区不保证连续。

  • 普通表默认每个页是16K,区的大小固定为1M(默认64个页)。

  • 碎片页,最大32页。innodb_file_per_table 开启后,创建的表默认大小是96KB。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BAu0OI4j-1608172012620)(C:\Users\stanley.wang\AppData\Roaming\Typora\typora-user-images\image-20201215180626158.png)]

page的数据结构

  • 文件头(FIleHeader):38个字节,记录页的通用信息,如表空间、上下页的页号,页类型等。
  • 页头(PageHeader):56个字节,记录本页记录的状态信息,如本页记录数量,槽数量,索引层等。
  • 最小记录和最大记录(Infimum + supremum):26个字节。
  • 数据行(User Records):用来放行数据。
  • 空闲空间(Free Space):存数据空间中尚未使用的区域。
  • 数据页目录(Page Directory):数组,放的是主键与数据的映射关系。
  • 文件尾部(File Trailer):8个字节。

参考

row的数据结构

变长字段的长度列表、NULL值列表、数据头、隐藏字段、存储信息

  • 变长字段长度列表: 十六机制, 逆序排列
  • null值列表: 二进制, 1说明是NULL, 0说明不是NULL, 逆序排列
  • 数据头: 40bit(1/2位是预留位, 3是delete_mask, 4是min_rec_mask, 5-8是n_owned,
    9-22是heap_no, 22-24是record_type, 24-40是next_record)
  • 隐藏字段: DB_ROW_ID(隐藏ID)、DB_TRX_ID(当前事务ID)、DB_ROLL_PTR(undo日志版本号)
  • 存储信息

eg:

nameageclassnoremark
张三189是一个男生啊啊啊

0x08 0x02 01000 0000000000000000000010000000000000011001 00000000094C 00000000032D EA000010078E 张三189是一个男生啊啊啊

ps:mysql怎么区分null和empty

row的数据头结构

  • 1-2:预留位,没任何含义。
  • 3:delete_mask,标识的是这行数据是否被删除,在MySQL里删除一行数据的时候会将该标志位置为1,彻底删除(optimize table tablename)。
  • 4:min_rec_mask,在B+树里每一层的非叶子节点里的最小值都有这个标记。
  • 5-8:n_owned,表示当前槽管理的记录数。
  • 9-22:heap_no,当前记录在当前页中的位置从2开始,0-最小记录,1-最大记录。
  • 22-24:record_type,行数据的类型,0代表的是普通类型,1代表的是B+树非叶子节点,2代表的是最小值数据,3代表的是最大值数据。
  • 25-40:next_record, 下一条数据的指针(页链表),规定最小记录的下一条记录就本页中主键值最小的记录,而本页中主键值最大的记录的下一条记录就是最大记录。

参考

3、缓存池(buffer pool)

基础属性

  • innodb_buffer_pool_size: 总容量

  • innodb_buffer_pool_instance: 缓冲池个数

缓存池里的数据结构

  • 缓存页:用来放磁盘数据页。有数据页、空闲页、索引页。

  • hash表:缓存池缓存表,key是表空间号+数据页号,value是缓存页的地址。

  • free链表:空闲页链表,value是缓存页元数据块。双向链表。

  • flush链表:将缓冲池里更新后的脏页放在链表上供后台线程更新磁盘数据时用。

  • lru链表:淘汰链表,当缓存池缓存页不够时将缓存页刷到磁盘,将缓存页更新为空闲页。

当一个查询sql执行时

  • 先由索引页算出所需数据页,从hash表判断是否含有所需数据页信息,如果有直接从缓存池中查询返回。

  • 如果没有则从free链表获取一个空闲块的空页,将磁盘页加载进空闲页。从free链表剔除空闲块信息,将该数据页添加进hash表。

  • 将数据加载进lru链表冷数据区头部。

当一个更新sql执行时

  • 先从hash表查看缓存池中是否含有sql的缓存页信息,如果没有就从磁盘加载进缓冲池。

  • 对需要更新的数据加索引记录锁,将原值写入undo日志。

  • 更新缓冲池里面数据(磁盘数据未修改),将更新后值命令写入redolog buffer(放redo日志的)。

  • 提交事务,将redo日志写入磁盘文件(数据还未修改), 同时写binlog日志, 最后在redo日志写commit命令。

  • 将缓存池里的缓存页加入flush链表, 后台线程异步随机将缓冲池数据刷新到磁盘。

  • 刷新lru链表。

redo日志提交策略(innodb_flush_log_at_trx_commit)

  • 0:提交事务不会把redo log buffer里的数据刷入磁盘文件。
  • 1:提交事务必须把redo log从内存刷入到磁盘文件。
  • 2: 提交事务把redo日志写入磁盘文件对应的os cache缓存里去, 可能1秒后才会把os cache里的数据写入到磁盘文件。

ps1:为什么还要有 redolog buffer
ps2:redolog日志和binlog的区别

lru预读机制和淘汰机制

  • 冷热分离:冷数据区默认37%(innodb_old_blocks_pct)。
  • 冷数据区域头部的信息在1s(innodb_old_blocks_time)后访问才会挪动到热区域头部去。
  • 热数据前1/4的数据再次被访问不会移动。
  • 淘汰触发时机:定时任务和加载时淘汰。
    在这里插入图片描述
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值