InnoDB引擎

最新推荐文章于 2024-03-28 08:42:48 发布

一千零一夜丶

最新推荐文章于 2024-03-28 08:42:48 发布

阅读量781

点赞数 24

文章标签： mysql

本文链接：https://blog.csdn.net/z2775640561/article/details/135140527

版权

一:逻辑存储结构

1.表空间（ibd文件）：一个MySQL示例可以对应多个表空间，用于存储记录、索引等数据

2.段：分为数据段（leaf node segment）、索引段（Non-leaf node segment）、回滚段（Rollback-segment）、InnoDB是索引组织表，数据段就是B+树的叶子节点，索引段即为B+树的非叶子节点。段用来管理多个Extent（区）

3.区：表空间的单元结构，每个区的大小为1M。默认情况下，InnoDB存储引擎页大小为16K，即一个区中一共有64个连续的页

4.页：是InnoDB存储引擎磁盘管理的最小单元，每个页的大小默认为16KB。为了保证页的连续性，InnoDB存储引擎每次从磁盘申请4-5个区

5.行：InnoDB存储引擎数据是按行进行存放的（

Trx_id：每次对某条记录进行改动时，都会把对应的事务id赋值给trx_id隐藏列

Rool_pointer：每次对某条记录进行改动时，都会把旧的版本写入到undo日志中，然后这个隐藏列就相当于下一个指针，可以通过它来找到该记录修改前的信息。）

二:架构

MySQL5.5版本开始，默认使用InnoDB存储引擎，它擅长处理事务，具有崩溃恢复特性，在日常开发中使用非常广泛。下面是InnoDB架构圈，左侧为磁盘结构

1.内存架构

①Buffer Pool：缓冲池是主内存中的一个区域，里面可以缓存磁盘上经常操作的真实数据，在执行增删改查操作时，先操作缓冲池中的数据（若缓冲池没有数据，则从磁盘加载并删除缓存），然后再以一定频率刷新到磁盘，从而减少磁盘IO，加快处理速度

②缓冲池以Page页为单位，底层采用链表数据结构管理Page。根据状态，将Page分为三种类型：

·free page：空闲page，未被使用

·clean page：被使用page，数据没有被修改过

·dirty page：脏页，被使用page，数据被修改过，池中数据与磁盘的数据发生了不一致

③Change Buffer：更改缓冲区（针对于非唯一二级索引页），在执行DML语句时，如果这些数据Page没有在Buffer Pool中，不会直接操作磁盘，而会将数据变更存在更改缓冲区Change Buffer中，在未来数据被读取时，再将数据合并恢复到Buffer Pool中，再将合并后的数据刷新到磁盘中。

Change Buffer的意义是什么？

与聚集索引不同，二级索引通常是非唯一的，并且以相对随机的顺序插入二级索引。同样，删除和更新可能会影响索引树中不相邻的二级索引页，如果每一次都操作磁盘，会造成大量的磁盘IO。有了Change Buffer之后，我们可以在缓冲池中进行合并处理，减少磁盘IO。

④Adaptive Hash Index：自适应hash索引，用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控对表上各索引页的查询，如果观察到hash索引可以提升速度，则建立hash索引，称之为自适应hash索引。

自适应哈希索引，无需人工干预，是系统根据情况自动完成。

参数：adaptive_hash_index

⑤Log Buffer：日志缓冲区，用来保存要写入到磁盘中的log日志数据（redo log、undo log），默认大小为16MB，日志缓冲区的日志会定期刷新到磁盘中。如果需要更新、插入或删除多行的事务，增加日志缓冲区的大小可以节省磁盘I/O。

参数：

innodb_log_buffer_size：缓冲区大小

innodb_flush_log_at_trx_commit：日志刷新到磁盘时机(

1:日志在每次事务提交时写入并刷新到磁盘

0:每秒将日志写入并刷新到磁盘一次

2:日志在每次事务提交后写入，并每秒刷新到磁盘一次

)

2.磁盘架构

3.后台线程

①Master Thread

核心后台线程，负责调度其他线程，还负责将缓冲池中的数据异步刷新到磁盘中，保持数据的一致性，还包括脏页的刷新、合并插入缓存、undo页的回收

②IO Thread

在InnoDB存储引擎中大量使用了AIO来处理IO请求，这样可以极大地提高数据库的性能，而IO Thread主要负责这些IO请求的回调

③Purge Thread

主要用于回收事务已经提交了的undo log，在事务提交之后，undo log可能不用了，就用它来回收

④Page Cleaner Thread

协助Master Thread 刷新脏页到磁盘的线程，它可以减轻Master Thread 的工作压力，减少阻塞

注意：nnoDB的整个体系结构为：

当业务操作的时候直接操作的是内存缓冲区，如果缓冲区当中没有数据，则会从磁盘中加载到缓冲区，增删改查都是在缓冲区的，后台线程以一定的速率刷新到磁盘。

三:事务原理

1.事务是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。

2.特性：

·原子性（Atomicity）：事务是不可分割的最小操作单元，要么全部成功，要么全部失败

·一致性（Consistency）：事务完成时，必须使所有的数据都保持一致状态

·隔离性（Isolation）：数据库系统提供的隔离机制，保证事务在不受外部并发操作影响的独立环境下运行

·持久性（Durability）：事务一旦提交或回滚，它对数据库中的数据改变就是永久的

3.redo log

重做日志，记录的是事务提交时的数据页的物理修改，是用来实现事务的持久性。该日志文件由两部分组成：重做日志缓冲（redo log buffer）以及重做日志文件（redo log file），前者是在内存中，后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中，用于刷新脏页到磁盘，发生错误时，进行数据恢复使用。（遵循WAL(Write-Ahead Logging)机制）

4.undo log

回滚日志，用于记录数据被修改前的信息，作用包含两个：提供回滚和MVCC(多版本并发控制)

undo log和redo log记录物理日志不一样，它是逻辑日志。可以认为当delete一条记录时，undo log中会记录一条对应的insert记录，反之依然，当update一条记录时，它记录一条对应相反的update记录。当执行rollback时，就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。

Undo log销毁：undo log在事务执行时产生，事务提交时，并不会立即删除undo log，因为这些日志可能还用于MVCC。

Undo log存储：undo log采用段的方式进行管理和记录，存放在前面介绍的rollback segment回滚段中，内部包含1024个undo log segment。

四:MVCC

·当前读

读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。对于我们日常的操作，如：

select...lock in share mode（共享锁）。
select..…for update、update、insert、delete（排他锁）都是一种当前读。

·快照读

简单的select（不加锁）就是快照读，快照读，读取的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读。

Read Committed：每次select，都生成一个快照读。
Repeatable Read：开启事务后第一个select语句才是快照读的地方。
Serializable：快照读会退化为当前读。

·MVCC

全称Multi-Version Concurrency Control，多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突，快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现，还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。

1.记录中的隐藏字段

2.undo log

①回滚日志，在insert、update、delete的时候产生的便于数据回滚的日志。当insert的时候，产生的undo log日志只在回滚时需要，在事务提交后，可被立即删除。而update、delete的时候，产生的undo log日志不仅在回滚时需要，在快照读时也需要，不会立即被删除。

②undo log版本链

不同事务或相同事务对同一条记录进行修改，会导致该记录的undo log生成一条记录版本链表，链表的头部是最新的旧记录，链表尾部是最早的旧记录。

3.readview

ReadView（读视图）是快照读SQL执行时MVCC提取数据的依据，记录并维护系统当前活跃的事务（未提交的）id。

ReadView中包含了四个核心字段：

版本数据链访问规则：

不同的隔离级别，生成ReadView的时机不同

REAN COMMTTED:RC隔离级别下，在事务中每一次执行快照读时生成ReadView。

REPEATABLE READ:RR隔离级别下，在事务中第一次执行快照读时生成ReadView，后续会复用该ReadView。

一千零一夜丶

关注

24
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
InnoDB引擎

③Change Buffer：更改缓冲区（针对于非唯一二级索引页），在执行DML语句时，如果这些数据Page没有在Buffer Pool中，不会直接操作磁盘，而会将数据变更存在更改缓冲区Change Buffer中，在未来数据被读取时，再将数据合并恢复到Buffer Pool中，再将合并后的数据刷新到磁盘中。下面是InnoDB架构圈，左侧为磁盘结构。当业务操作的时候直接操作的是内存缓冲区，如果缓冲区当中没有数据，则会从磁盘中加载到缓冲区，增删改查都是在缓冲区的，后台线程以一定的速率刷新到磁盘。
复制链接

扫一扫