mysql 插入缓冲_InnoDB引擎之-插入缓冲(Insert Buffer)

本文详细介绍了InnoDB引擎的插入缓冲(Insert Buffer)机制,旨在提升非聚集索引插入性能。插入缓冲通过将非聚集索引的插入操作先存储在缓冲对象中,然后在合适时机与辅助索引页合并,减少了磁盘的随机读取,尤其适用于非唯一非聚集索引。此外,文章还讨论了插入缓冲的限制、信息查看和优化策略。
摘要由CSDN通过智能技术生成

InnoDB引擎有几个重点特性,为其带来了更好的性能和可靠性:

插入缓冲(Insert Buffer)

两次写(Double Write)

自适应哈希索引(Adaptive Hash Index)

异步IO(Async IO)

刷新邻接页(Flush Neighbor Page)

今天主题就是 插入缓冲(Insert Buffer),由于InnoDB引擎底层数据存储结构式B+树,对于索引又有聚集索引和非聚集索引。

在进行数据插入时必然会引起索引的变化,聚集索引一般都是递增有序的。非聚集索引就不一定是什么数据了,其离散性导致了在插入时结构的不断变化,从而导致插入性能降低。

为了解决非聚集索引插入性能的问题,InnoDB引擎 创造了Insert Buffer。

Insert Buffer 存储

e7186cf057a9

InnerDB存储引擎内存结构

上图可能大家会认为Insert Buffer 就是InnoDB 缓冲池的一个组成部分。

重点:其实对也不对,InnoDB 缓冲池确实包含了Insert Buffer的信息,但Insert Buffer 和数据页一样,也是物理存在的(以B+树的形式存在共享表空间中)。

Insert Buffer 作用

先说几个点:

一张表只能有一个主键索引,那是因为其物理存储是一个B+树。(别忘了聚集索引叶子节点存储的数据,而数据只有一份)

非聚集索引叶子节点存的是聚集索引的主键

Insert Buffer 插入过程

聚集索引插入

在InnoDB存储引擎中,主键是行唯一的标识符(聚集索引)。

插入数据一般都是按照主键递增插入,因此聚集索引都是顺序的,不需要磁盘的随机读取。

比如表:

CREATE TABLE test(

id INT AUTO_INCREMENT,

name VARCHAR(30),

PRIMARY KEY(id)

);

上表中主键 id,它有以下的特性:

id列是自增长的

id列插入NULL值时,由于AUTO_INCREMENT的原因,其值会递增

同时数据页中的行记录按id的值进行顺序存放

一般情况下由于聚集索引的有序性,不需要随机读取页中的数据,顺序插入速度是非常快的。

但如果你把列 id 插入UUID这种数据,那你插入就是和非聚集索引一样都是随机的了。会导致你的B+ tree结构不停地变化,那性能必然会受到影响。

非聚集索引插入

表中一般有很多非聚集索引,比如我按照b字段查询,且b字段不是唯一的。如下表:

CREATE TABLE test(

id INT AUTO_INCREMENT,

name VARCHAR(30),

PRIMARY KEY(id),

KEY(name)

);

如上表:

有一个聚集索引 id

有一个不唯一的非聚集索引 name

在插入数据时数据页是按照主键id进行顺序存放

辅助索引 name的数据插入不是顺序的

非聚集索引也是一颗B+树,只是叶子节点存的是聚集索引的主键和name 的值.因为不能保证name列的数据是顺序的,所以非聚集索引这棵树的插入必然也不是顺序的了。当然如果name列插入的是时间类型数据,那其非聚集索引的插入也是顺序的。

可以看出非聚集索引插入的离散性导致了插入性能的下降,因此InnoDB引擎设计了 Insert Buffer来提高插入性能 。

Insert Buffer 插入过程:

1. 首先对于非聚集索引的插入或更新操作,不是每一次直接插入到索引页中,而是先判断插入的非聚集索引页是否在缓冲池中。

2. 若在,则直接插入;若不在,则先放入到一个Insert Buffer对象中。

3. 给外部的感觉好像是树已经插入非聚集的索引的叶子节点,而其实是存放在其他位置了

以一定的频率和情况进行Insert Buffer和辅助索引页子节点的merge(合并)操作,通常会将多个插入操作一起进行merge,这就大大的提升了非聚集索引的插入性能。

Insert Buffer的使用要求:

索引是非聚集索引

索引不是唯一(unique)的

只有满足上面两个必要条件时,InnoDB存储引擎才会使用Insert Buffer来提高插入性能。

那为什么必须满足上面两个条件呢?

第一点索引是非聚集索引就不用说了,人家聚集索引本来就是顺序的也不需要你

第二点必须不是唯一(unique)的,因为在写入Insert Buffer时,数据库并不会去判断插入记录的唯一性。如果再去查找肯定又是离散读取的情况了,这样Insert Buffer就失去了意义。

Insert Buffer信息查看

我们可以使用命令SHOW ENGINE INNODB STATUS来查看Insert Buffer的信息:

mysql> show engine innodb status

-------------------------------------

INSERT BUFFER AND ADAPTIVE HASH INDEX

-------------------------------------

Ibuf: size 7545, free list len 3790, seg size 11336,

8075308 inserts,7540969 merged sec, 2246304 merges

...

使用命令后,我们会看到很多信息,这里我们只看下INSERT BUFFER 的:

seg size 代表当前Insert Buffer的大小 11336*16KB

free listlen 代表了空闲列表的长度

size 代表了已经合并记录页的数量

Inserts 代表了插入的记录数

merged recs 代表了合并的插入记录数量

merges 代表合并的次数,也就是实际读取页的次数

merges:merged recs大约为1∶3,代表了Insert Buffer 将对于非聚集索引页的离散IO逻辑请求大约降低了2/3

Insert Buffer的问题

说了这么多针对于Insert Buffer的好处,但目前Insert Buffer也存在一个问题:

即在写密集的情况下,插入缓冲会占用过多的缓冲池内存(innodb_buffer_pool),默认最大可以占用到1/2的缓冲池内存。

占用了过大的缓冲池必然会对其他缓冲池操作带来影响

Insert Buffer的优化

MySQL5.5之前的版本中其实都叫做Insert Buffer,之后优化为 Change Buffer可以看做是 Insert Buffer 的升级版。

插入缓冲( Insert Buffer)这个其实只针对 INSERT 操作做了缓冲,而Change Buffer 对INSERT、DELETE、UPDATE都进行了缓冲,所以可以统称为写缓冲,其可以分为:

Insert Buffer

Delete Buffer

Purgebuffer

总结:

Insert Buffer到底是个什么?

其实Insert Buffer的数据结构就是一棵B+树。

在MySQL 4.1之前的版本中每张表有一棵Insert Buffer B+树

目前版本是全局只有一棵Insert Buffer B+树,负责对所有的表的辅助索引进行Insert Buffer

这棵B+树存放在共享表空间ibdata1中

以下几种情况下 Insert Buffer会写入真正非聚集索引,也就是所说的Merge Insert Buffer

当辅助索引页被读取到缓冲池中时

Insert Buffer Bitmap页追踪到该辅助索引页已无可用空间时

Master Thread线程中每秒或每10秒会进行一次Merge Insert Buffer的操作

一句话概括下:Insert Buffer 就是用于提升非聚集索引页的插入性能的,其数据结构类似于数据页的一个B+树,物理存储在共享表空间ibdata1中 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值