2.3 Innodb存储引擎之Master Thread工作方式

2.5 Master Thread工作方式

2.5.1 InnoDB 1.0.x 版本之前的 Master Thread

  • Master Thread具有最高的线程优先级别。其内部由多个循环(loop)组成∶主循环(loop)、后台循环(backgroup loop)、刷新循环(flushloop)、暂停循环(suspend loop)。 Master Thread 会根据数据库运行的状态在 loop、background loop、flush loop 和 suspend loop 中进行切换。
  • Loop 被称为主循环,因为大多数的操作是在这个循环中,其中有两大部分的操作——每秒钟的操作和每 10 秒的操作。伪代码如下∶
    在这里插入图片描述
  • 可以看到,loop循环通过 thread sleep 来实现,这意味着所谓的每秒一次或每 10 秒一次的操作是不精确的。在负载很大的情况下可能会有延迟(delay),只能说大概在这个频率下。当然,InnoDB 源代码中还通过了其他的方法来尽量保证这个频率。
  • 每秒一次的操作包括∶
  1. 日志缓冲刷新到磁盘,即使这个事务还没有提交(总是);
  2. 合并插入缓冲(可能);
  3. 至多刷新 100 个 InnoDB 的缓冲池中的脏页到磁盘(可能);
  4. 如果当前没有用户活动,则切换到 background loop(可能)。
  • 即使某个事务还没有提交,InnoDB 存储引擎仍然每秒会将重做日志缓冲中的内容刷新到重做日志文件。这一点是必须要知道的,因为这可以很好地解释为什么再大的事务提交(commit)的时间也是很短的。
  • 合并插入缓冲(Insert Buffer)并不是每秒都会发生的。InnoDB 存储引擎会判断当前一秒内发生的 IO次数是否小于5次,如果小于5次,InnoDB 认为当前的 IO 压力很小,可以执行合并插入缓冲的操作。
  • 同样,刷新 100 个脏页也不是每秒都会发生的。InnoDB存储引擎通过判断当前缓冲池中脏页的比例(buf get modified ratio pct)是否超过了配置文件中 innodb max dirty_pages_pct 这个参数(默认为 90,代表 90%),如果超过了这个阈值,InnoDB 存储引擎认为需要做磁盘同步的操作,将 100 个脏页写入磁盘中。
  • 总结上述操作,伪代码可以进一步具体化,如下所示∶

在这里插入图片描述

接着来看每 10 秒的操作,包括如下内容∶

  1. 刷新 100 个脏页到磁盘(可能的情况下);
  2. 合并至多5个插入缓冲(总是);
  3. 将日志缓冲刷新到磁盘(总是);
  4. 删除无用的 Undo 页(总是);
  5. 刷新 100 个或者 10个脏页到磁盘(总是)。
  • 在以上的过程中,InnoDB 存储引擎会先判断过去 10 秒之内磁盘的 IO 操作是否小于 200 次,如果是,InnoDB 存储引擎认为当前有足够的磁盘 IO操作能力,因此将 100个脏页刷新到磁盘。接着,InnoDB 存储引擎会合并插入缓冲。不同于每秒一次操作时可能发生的合并插入缓冲操作,这次的合并插入缓冲操作总会在这个阶段进行。之后, InnoDB 存储引擎会再进行一次将日志缓冲刷新到磁盘的操作。这和每秒一次时发生的操作是一样的。

  • 接着 InnoDB存储引擎会进行一步执行 full purge 操作,即删除无用 的 Undo页。对表进行 update、delete 这类操作时,原先的行被标记为删除,但是因为一致性读(consistent read)的关系,需要保留这些行版本的信息。但是在 full purge 过程中, InnoDB 存储引擎会判断当前事务系统中已被删除的行是否可以删除,比如有时候可能还有查询操作需要读取之前版本的 undo 信息,如果可以删除,InnoDB 会立即将其删除。

  • 从源代码中可以发现,InnoDB 存储引擎在执行 full purge 操作时,每次最多个尝试回收20个undo 页。

    • 然后,InnoDB存储引擎会判断缓冲池中脏页的比例(buf_get_modified_ratio_pct),如果有超过70%的脏页,则刷新 100 个脏页到磁盘,如果脏页的比例小于 70%,则只需刷新 10% 的脏页到磁盘。
  • 现在我们可以完整地把主循环(main loop)的伪代码写出来了,内容如下∶
    在这里插入图片描述

  • 接着来看 background loop,若当前没有用户活动(数据库空闲时)或者数据库关闭
    (shutdown),就会切换到这个循环。background loop 会执行以下操作∶

  1. 删除无用的 Undo 页(总是);
  2. 合并 20个插入缓冲(总是);
  3. 跳回到主循环(总是);
  4. 不断刷新 100 个页直到符合条件(可能,跳转到 flush loop 中完成)。
  • 若 flush loop 中也没有什么事情可以做了,InnoDB存储引擎会切换到 suspend loop,将 Master Thread挂起,等待事件的发生。若用户启用(enable)了InnoDB 存储引擎,却没有使用任何 InnoDB 存储引擎的表,那么 Master Thread 总是处于挂起的状态。
  • 最后,Master Thread完整的伪代码如下;
    在这里插入图片描述

在这里插入图片描述

2.5.2 InnoDB1.2.x 版本之前的 Master Thread

  • 在了解了1.0.x版本之前的 Master Thread的具体实现过程后,细心的读者会发现 InnoDB 存储引擎对于 IO 其实是有限制的,在缓冲池向磁盘刷新时其实都做了一定的硬编码(hard coding)。在磁盘技术飞速发展的今天,当固态磁盘(SSD)出现时,这种规定在很大程度上限制了InnoDB 存储引擎对磁盘 IO 的性能,尤其是写入性能。
  • 从前面的伪代码来看,无论何时,InnoDB 存储引擎最大只会刷新 100个脏页到磁盘,合并 20个插入缓冲。如果是在写入密集的应用程序中,每秒可能会产生大于100个的脏页,如果是产生大于20 个插入缓冲的情况,Master Thread 似乎会"忙不过来",或者说它总是做得很慢。即使磁盘能在 1 秒内处理多于100 个页的写入和 20个插入缓冲的合并,但是由于hard coding,Master Thread 也只会选择刷新 100 个脏页和合并 20个插入缓冲。同时,当发生宕机需要恢复时,由于很多数据还没有刷新回磁盘,会导致恢复的时间可能需要很久,尤其是对于 insert buffer 来说。
  • 这个问题最初由 Google 的工程师 Mark Callaghan 提出,之后 InnoDB 官方对其进行了修正并发布了补丁(patch)。InnoDB存储引擎的开发团队参考了Google 的 patch,提供了类似的方法来修正该问题。因此 InnoDB Plugin(从 InnoDB1.0.x 版本开始)提供了参数 innodb_io_capacity,用来表示磁盘 IO 的吞吐量,默认值为 200。对于刷新到磁盘页的数量,会按照 innodb_io_capacity 的百分比来进行控制。规则如下∶
  1. 在合并插入缓冲时,合并插入缓冲的数量为 innodb_io_capacity 值的 5%;
  2. 在从缓冲区刷新脏页时,刷新脏页的数量为 innodb_io_capacity。
  • 若用户使用了 SSD 类的磁盘,或者将几块磁盘做了RAID,当存储设备拥有更高的 IO速度时,完全可以将 innodb_io_capacity 的值调得再高点,直到符合磁盘IO的吞吐量为止。
  • 另一个问题是,参数 innodb max_dirty_pages_pct 默认值的问题,在 InnoDB 1.0.x版本之前,该值的默认为 90,意味着脏页占缓冲池的 90%。但是该值"太大"了,因为 InnoDB 存储引擎在每秒刷新缓冲池和 flush loop 时会判断这个值,如果该值太争 innodb_max_dirty_pages_pct,才刷新 100 个脏页,如果有很大的内存,或者数据库服务器的压力很大,这时刷新脏页的速度反而会降低。同样,在数据库的恢复阶段可能需要更多的时间。
  • 在很多论坛上都有对这个问题的讨论,有人甚至将这个值调到了20 或 10,然后测试发现性能会有所提高,但是将 innodb max dirty pages pct 调到 20 或 10 会增加磁盘的压力,系统的负担还是会有所增加的。Google 在这个问题上进行了测试,证明 20 并不是一个最优值。而从 InnoDB 1.0.x 版本开始,innodb_max_dirty_pages_pct 默认值变为了75,和 Google 测试的 80 比较接近。这样既可以加快刷新脏页的频率,又能保证了磁盘 IO 的负载。
  • InnoDB 1.0.x 版本带来的另一个参数是 innodb adaptive flushing(自适应地刷新),该值影响每秒刷新脏页的数量。原来的刷新规则是∶ 脏页在缓冲池所占的比例小于 innodb max_dirty_pages_pct 时,不刷新脏页;大于innodb_max_dirty_pages_pct 时,刷新 100个脏页。随着 innodb adaptive flushing 参数的引入,InnoDB 存储引擎会通过—个名为 buf_flush_get_desired_flush_rate 的函数来判断需要刷新脏页最合适的数量。粗略地翻阅源代码后发现buf_flush_get_desired_flush_rate 通过判断产生重做日志(redo log)的速度来决定最合适的刷新脏页数量。因此,当脏页的比例小于innodb_max_dirty_pages_ pct 时,也会刷新一定量的脏页。
  • 还有一个改变是∶ 之前每次进行 full purge 操作时,最多回收 20个 Undo 页,从 InnoDB 1.0.x 版本开始引人了参数 innodb_purge_batch_size,该参数可以控制每次 full purge 回收的 Undo 页的数量。该参数的默认值为 20,并可以动态地对其进行修改,具体如下∶
    在这里插入图片描述
    通过上述的讨论和解释我们知道,从InnoDB 1.0.x 版本开始,Master Thread的伪码必将有所改变,最终变成∶
    在这里插入图片描述
  • 很多测试都显示,InnoDB 1.0.x 版本在性能方面取得了极大的提高,其实这和前面提到的 Master Thread 的改动是密不可分的,因为 InnoDB 存储引擎的核心操作大部分都集中在 Master Thread 后台线程中。
  • 从 InnoDB 1.0.x 开始,命令 SHOW ENGINE INNODB STATUS 可以查看当前 Master Thread 的状态信息,如下所示∶
    在这里插入图片描述
  • 这里可以看到主循环进行了 45 次,每秒挂起(sleep)的操作进行了 45 次(说明负载不是很大),10秒一次的活动进行了4次,符合 1∶10。background loop 进行了6次, flush loop 也进行了6次。因为当前这台服务器的压力很小,所以能在理论值上运行。如果是在一台压力很大的 MySQL 数据库服务器上,看到的可能会是下面的情景∶
    在这里插入图片描述
  • 可以看到当前主循环运行了2188次,但是循环中的每秒挂起(sleep)的操作只运行了1537次。这是因为 InnoDB 对其内部进行了一些优化,当压力大时并不总是等待 1秒。因此,并不能认为1_second和 sleeps 的值总是相等的。在某些情况下,可以通过两者之间差值的比较来反映当前数据库的负载压力。

2.5.3 InnoDB 1.2.x版本的 Master Thread

  • 在 InnoDB 1.2.x 版本中再次对 Master Thread 进行了优化,由此也可以看出 Master Thread 对性能所起到的关键作用。在 InnoDB 1.2.x版本中,Master Thread 的伪代码如下∶
if InnoDB is idle
srv_master_do_idle_tasks () ; 
else
srv_master_do_active_tasks ();
  • 其中 srv_master do_idle_tasks()就是之前版本中每 10秒的操作,srv_master_do_ active_tasksO)处理的是之前每秒中的操作。同时对于刷新脏页的操作,从 Master Thread线程分离到一个单独的 Page Cleaner Thread,从而减轻了Master Thread 的工作,同时进一步提高了系统的并发性。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值