MySQL 事务、日志、锁,大厂Java开发面试解答

使用单独文件存储表数据,在删除表时直接删除文件可以回收空间。

**而在共享表空间中存储,即使将表删除,空间也是不会回收的。**因为InnoDB 中数据以B+树结构组织,删除其中一部分记录,只是将其相应的位置标记为删除可复用(由于索引排序,记录只能被相应的数据所复用);而当数据页上所有记录都被删除时,意味着数据页可以复用到任意位置。

在删除数据之后而又没用复用时,就会造成数据空洞;同样的,在新增时也可能导致数据空洞,当一个数据页A已经写满了,但由于索引的有序性,需要在A中间再插入一条数据,这时就需要进行页分裂再申请一个数据页来保存数据(当前数据以及之后的索引分裂到新的数据页)。

在大量增删操作之后的表可能存在数据空洞,即很多位置无法复用。通过重建表可以实现空间收缩:

  1. recreate table: alter table t engine = InnoDB,可以实现在线重建表,短暂持有MDL写锁,之后持有MDL读锁。使用一个rowlog存储重建表期间表数据的修改记录,不会阻塞其他事务的增删改。

  2. analyze table t 对表的索引信息做重新统计,没有修改数据,加MDL读锁。

  3. optimize table t 等于recreate+analyze。

日志

MySQL 中记录日志的方式为WAL(Write-Ahead Logging),先预写日志再更新数据,对于非内存数据库来说,可以减少磁盘IO提高性能。

MySQL日志:

  1. binlog:在对数据进行增删改之后,都将会记录一条binlog,可用于数据归档和备份,存在两种格式的binlog

《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》

【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享

_format:

  1. statement记录的是SQL语句,最后会有COMMIT。

  2. row记录的实际操作的数据记录,最后会有一个XID event。

sync_binlog设置为1时,表示每次事务操作的binlog都持久化到磁盘中,在MySQL异常重启后可保证binlog不丢失。

InnoDB日志:

  1. redolog:在对数据进行增删改之后,都将会记录一条redolog。其为物理日志,记录的是在某个数据页上做了什么修改,可用于崩溃后恢复事务数据和减少更新数据时的磁盘IO访问。innodb_flush_log_at_trx_commit这个参数设置成1的时候,表示每次事务的redo log都直接持久化到磁盘。

  2. undolog:在事务中对数据每进行一次修改便会记录一次undolog,用于将最新数据恢复到之前事务版本。在长事务中可能占用大量存储空间。在系统判定undo-log无用时,会将其删除,即在没有比回滚日志更早的Read View时。

binlog和redolog存在一个共同的数据字段XID,通过这个字段可以将redolog和binlog关联起来,可用于事务恢复。

索引

在InnoDB中,表数据都是根据主键顺序以索引的形式存放的,这种存储方式的表称为索引组织表。索引的底层数据结构为B+树,所以每一个索引在InnoDB中都对应一颗B+树,InnoDB中存在有两种类型的索引:

  1. 聚簇索引(主键)

聚簇索引的叶子结点存的是整行数据。

  1. 二级索引

二级索引分为唯一和普通索引,叶子结点中存的是主键的值,如果需要获取整行数据,需要使用主键值再去聚簇索引中回表查询。

索引维护:由于底层数据结构为B+树,所以维护索引就是在维护B+树;而B+树是有序的,插入更新数据时可能导致数据移动而引入额外磁盘IO。而在索引字段重复时,又会页分裂出新的数据页来保存重复Key。

创建高性能索引

B+ 树的高和阶:阶由页大小(默认16K)和索引大小而决定,而高又由阶和行数决定。

InnoDB 事务

数据库事务是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成,具备四个基本属性,原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Duarbility)。

如何启动/回滚事务:

  1. 手动使用 BEGIN, ROLLBACK, COMMIT来实现;BEGIN 开始一个事务,ROLLBACK 事务回滚,COMMIT 事务提交

  2. 直接用 SET AUTOCOMMIT = 0/1 来改变 MySQL 的自动提交模式:

  • 若参数autocommit=0(禁止自动提交),事务则在用户本次对数据进行操作时自动开启,在用户执行commit命令时提交,用户本次对数据库开始进行操作到用户执行commit命令之间的一系列操作为一个完整的事务周期。若不执行commit命令,系统则默认事务回滚。总而言之,当前情况下事务的状态是自动开启手动提交。

  • 若参数autocommit=1(系统默认值,开启自动提交),事务的开启与提交又分为两种状态:

  • 手动开启手动提交:当用户执行start transaction命令时(事务初始化),一个事务开启,当执行commit命令时事务提交,若不执行commit命令,系统则默认事务回滚。

  • 自动开启自动提交:如果用户在当前情况下未执行start transaction命令而对数据库进行了操作,系统则默认用户对数据库的每一个操作为一个孤立的事务,也就是说用户每进行一次操作系都会即时提交或者即时回滚。

事务提交:

InnoDB中事务分为两阶段提交:

  1. 第一阶段是在更新完数据后,记录redo-log,这时redolog状态为prepare

  2. 第二阶段是在记完redo-log之后,记录bin-log,将redolog状态置为commit

两阶段提交常用于分布式系统中,InnoDB 中使用两阶段提交可以保证在事务恢复时,其binlog是正确的;如果只记录redolog,在恢复事务之后就会导致数据与binlog不一致。

事务恢复

得益于两阶段提交,事务在恢复之后可以保证数据与binlog的一致,事务恢复时的判断规则为:

  1. 如果redo log里面的事务是完整的,也就是有prepare、commit标识,则直接提交;

  2. 如果redo log里面的事务只有完整的prepare,则判断对应的事务binlog是否是存在并且完整的,如果是,则提交事务; 否则,回滚事务。

实现事务隔离

在InndDB中,通过MVCC(一致性视图)实现事务的隔离性,在InnoDB中,一行数据物理上只保存最新值,但通过undolog可以回滚到之前事务版本,所以数据可能存在多个版本(事务Id用作区分)。MVCC便是使用事务Id、数据、undolog来实现一致性视图(read-view),但在生成一致性读时,可重复读(Repeatable read)和读提交(read committed)的read view生成策略是不一致的:

  1. 在可重复读级别下,整个事务存在期间都使用同一个视图,只会获取小于等于当前事务Id版本数据,如果数据被更新了,就通过undolog计算得到相应版本的数据,解决了不可重复读问题

  2. 在读提交级别下,视图在每条SQL执行期间创建,只获取已提交的最新事务版本数据,所以每条SQL看到的数据可能都是不一致的,存在不可重复读问题

事务问题

  1. 在可重复读级别下,每条SQL使用到的锁需要等到事务提交或回滚之后才释放,存在长事务时,可能会占用的更多的资源,如锁、undolog等,所以应避免长事务并且将资源占用较多的SQL放在事务后程进行。

  2. 在读提交级别下,每条SQL使用到的锁在SQL执行完成后便会释放,在多事务并行时,如果binlog_format=statement时可能造成数据和binlog的不一致,所以应将其设置为row。

InnoDB 行锁、间隙锁、临键锁

行锁(record lock):

InnoDB事务中,一条更新语句执行时,必须要获得其行写锁,而行锁分为读锁和写锁,其中读锁之间兼容,读写锁、写锁之间互斥,如 select id from table1 lock in share mode 当前读加读锁;select if from table1 for update 当前读加写锁。在RR级别下,行锁在需要的时候才加上,但是得等到事务结束时才释放,这叫做两阶段锁协议,两阶段加锁协议主要为了保证事务的隔离性(解决不可重复读)和一致性(数据状态一致)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值