InnoDB原理篇:Change Buffer是如何提升索引性能的?

480 篇文章 6 订阅
480 篇文章 9 订阅

相信很多小伙伴设计索引时,考虑更多的是 索引是否能覆盖大部分的业务场景 ,却忽略了 索引的性能 。

什么?不同的索引,性能还不一样?

是的,这要从 change buffer 说起。

Change Buffer是什么

MySQL 在启动成功后,会向内存申请一块内存空间,这块内存空间称为 Buffer Pool 。

Buffer Pool 内维护了很多内容,比如 缓存页、各种链表、redo log buff、change buffer等等 。

回到正题, change buffer 是用来干嘛的?

当索引字段内容发生更新时( update、insert、delete ),要更新对应的 索引页 ,如果 索引页 在 Buffer Pool 里命中的话,就直接更新 缓存页 。

否则, InnoDB 会将这些更新操作缓存在 change buffer 中,这样就无需从硬盘读入 索引页 。

下次查询索引页时,会将索引页读入 Buffer Pool ,然后将 change buffer 中的操作应用到对应的缓存页,得到最新结果,这个过程称为 merge ,通过这种方式就能保证数据逻辑的正确性。

不难看出, change buffer 通过 减少硬盘随机IO读 与 提高内存利用率 ,让数据库的并发能力更强。

如果不了解 Buffer Pool、redo log、索引页 是什么,可以看看阿星之前写的几篇文章

看到这里小伙伴有疑问了, change buffer 在内存中,如果万一 MySql 实例挂了或宕机了,这次的更新操作不全丢了吗?

其实不用担心, InnoDB 对这块有相应的持久化方案,会有后台线程定期把 change buffer 持久化到硬盘的系统表空间( ibdata1 )。

并且每次 change buffer 记录的内容,会写入到 redo log buff 中,由后台线程定期将 redo log buff 持久化到硬盘的 redolog 日志。

最后 MySql 重启,可以通过 ibdata1 或 redolog 恢复 change buffer ,恢复的过程,分为下面几种情况

  1. change buffer
    ibdata
    ibdata
    
  2. change buffer
    redolog
    change buffer
    
    • change buffer
      redo log
      redo log
      commit
      binlog
      
    • change buffer
      redolog
      redolog
      commit
      binlog
      binlog
      redolog
      redolog
      change buffe
      
    • change buffer
      redolog
      redolog
      binlog
      redolog
      

如果不清楚 redolog 与 binlog 的可以看看下面这几篇文章

如何使用Change Buffer

看到这里,相信大家对 change buffer 有了基本的认识。

现在可以展开讲讲 change buffer 的使用限制。

是的,你没听错, change buffer 不能随随便便用。

一般我们可以把常用索引分类为下面几种

其中 聚簇索引 和 唯一索引 是无法使用 change buffer ,因为它们具备 唯一性 。

当更新 唯一索引 字段的内容时,需要把相应的索引页加载进 Buffer Pool ,验证唯一性约束,此时都已经读入到 Buffer Pool 了,那直接更新会更快,没必要使用 change buffer 。

也就是说,只有非唯一索引才能使用 change buffer

业务场景

那现在有一个问题,使用 change buffer 一定可以起到加速作用吗?

相信大家都清楚 merge 的时候是将 change buffer 记录的操作应用到索引页。

所以索引页 merge 之前, change buffer 记录的越多收益就越大。

因此对于写多读少的业务场景,索引页在写完以后马上被访问到的概率很小,此时 change buffer 的收益最高。

相反,读多写少的业务场景,更新完马上做查询,则会触发 change buff 立即 merge , 不但硬盘随机 IO次 没有减少,还增加 change buffer 的维护成本。

因此 change buff 适合写多读少的业务场景

选择索引

由于唯一索引用不上 change buffer 的优化机制,在业务可以接受的情况下,从性能角度出发建议考虑 非唯一索引

如果所有的更新后面,都马上伴随着对这个记录的查询,应该关闭 change buffer , innodb_change_buffering 设置为 none 表示关闭 change buffer 。

而在其他情况下 change buffer 都能提升更新性能。

我们可以通过 innodb_change_buffer_max_size 来动态设置 change buffer 占用的内存大小,假设参数设置为 50 的时候,表示 change buffer 的大小最多只能占用 buffer pool 的 50% 。

最后留个思考题,如果知道 redo log 一定清楚 WAL 机制, change buffer 与 WAL 分别提升性能的侧重点是什么?

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值