数据库--锁

一、概述

是计算机协调多个进程或线程并发访问某一资源的机制。在程序开发中会存在多线程同步的问题,当多个线程并发访问某个数据的时候,尤其是针对一些敏感的数据(比如订单、金额等),我们就需要保证这个数据在任何时刻最多只有一个线程在访问,保证数据的完整性一致性。在开发过程中加锁是为了保证数据的一致性,这个思想在数据库领域中同样很重要。

在数据库中,除传统的计算资源(如CPU、RAM、I/O等)的争用以外,数据也是一种供许多用户共享的资源。为保证数据的一致性,需要对并发操作进行控制,因此产生了。同时锁机制也为实现MySQL的各个隔离级别提供了保证。锁冲突也是影响数据库并发访问性能的一个重要因素。所以锁对数据库而言显得尤其重要,也更加复杂。

二、MySQL并发事务访问形同记录

并发事务访问相同记录的情况大致可以划分为3种:

2.1 读-读情况

读-读情况,即并发事务相继==读取相同的记录。==读取操作本身不会对记录又任何影响,并不会引起什么问题,所以允许这种情况的发生。

2.2 写-写情况

写-写情况,即并发事务相继对相同的事务的记录做出改动。
在这种情况下会发生脏写的问题,任何一种隔离级别都不允许这种问题的发生。所以在多个未提交事务相继对一条记录做改动时,需要让它们排队执行,这个排队的过程其实是通过来实现的。这个所谓的锁其实是一个内存中的结构,在事务执行前本来是没有锁的,也就是说一开始是没有锁结构和记录进行关联的。
在这里插入图片描述

当一个事务想对这条记录做改动时,首先会看内存中有没有与这条记录关联的锁结构,当没有的时候就会在内存中生成一个锁结构与之关联。比如:事务T1要对这条记录做改动,就需要生成一个锁结构与之关联:
在这里插入图片描述
锁结构里有很多信息,为了简化理解,这里只把两个比较重要的属性拿了出来:

  • trx信息: 代表这个锁结构是哪个事务生成的。
  • is_waiting: 代表当前事务是否在等待。

当事务T1改动了这条记录后,就生成一个锁结构与该记录关联。因为之前没有别的事务为这条记录加锁,所以 is_waiting的属性就是false。我们把这个场景称之为获取锁成功,或者加锁成功,然后就可以继续执行操作了。

在事务T1提交之前,另一个事务T2也想对该记录做改动,那么先看看有没有锁结构与这条记录关联,发现有一个锁结构与之关联后,也生成一个锁结构与这条记录关联,不过锁结构的is_waiting属性值为true,表示当前事务需要等待,我们把这个场景就称之为获取锁失败, 或者加锁失败。图示:
在这里插入图片描述
在事务T1提交只有,就会把该事务生成的锁结构释放掉,然后看看还有没有别的事务在等待获取锁,发现了事务T2对应的锁结构的is_waiting属性设置为false,然后把该事务对应的线程唤醒,让它继续执行,此时事务T2就算获取到了锁。效果图如下:
在这里插入图片描述

小结:

  • 不加锁:意思是不需要再内存中生成对应的锁结构,可以直接执行操作。
  • 获取锁成功或者加锁成功:在内存中生成了对应的锁结构,而且锁结构的is_waiting属性为false,也就是事务可以继续执行操作。
  • 获取锁失败,或者加锁失败,或者没有获取到锁: 在内存中生成了对应的锁结构,不过锁结构的is_waiting属性为true,也就是事务需要等待,不可以继续执行操作。

2.3 读-写或写-读情况

读-写或写-读,即一个事务进行读取操作,另一个进行改动操作。这种情况下可能发生脏读、不可重复度、幻读的问题。
各个数据库厂商对SQL标准的支持都可能不一样。比如MySQL在 REPEATABLE READ隔离级别上就已经解决了幻读问题。

2.4 并发问题的解决方案

怎么解决脏读、不可重复读、幻读这些问题呢?其实有两种可选的解决方案:

2.4.1 方案一:读操作利用多版本并发控制MVCC,写操作进行加锁

所谓的MVCC,就是生成一个ReadView,通过ReadView找到符合条件的记录版本(历史版本由undo日志构建)。查询语句只能到生成ReadView之前已提交事务所做的更改,在生成ReadView之前未提交的事务或者之后才开启的事务所做的更改是看不到的。而写操作肯定针对的是最新版本的记录,读记录的历史版本和改动记录的最新版本本身并不冲突,也就是采用MVCC时,读-写操作并不冲突。

普通的SELECT语句在READ COMMITTED 和REPEATABLE READ隔离级别下使用到MVCC读取记录。

  • 在READ COMMITTED隔离级别下,一个事务在执行过程中每次执行SELECT操作时都会生成一个ReadView,ReadView的存在本身就保证了事务不可以读取到未提交的事务所做的更改, 也就是避免了脏读现象。
  • 在REPEATABLE READ 隔离级别下,一个事务在执行过程中只有第一次执行SELECT操作才会生成一个ReadView,之后的SELECT操作都复用这个ReadView,这样也就避免了不可重复读和幻读的问题。

2.4.1 方案二:读、写操作都采用加锁的方式

如果我们的一些业务场景不允许读取记录的旧版本,而是每次都必须去读取记录的最新版本。这样在读取记录的时候就需要对其进行加锁操作,这样也就意味着读操作和写操作也像写-写操作那样排队执行

脏读的产生是因为当前事务读取了另一个未提交事务写的一条记录,如果另一个事务在写记录的时候就给这条记录加锁,那么当前事务就无法继续读取该记录了,所以也就不会有脏读问题的产生了。

不可重复读的产生时因为当前事务先读取一条记录,另外一个事务对该记录做了改动之后并提交,当前事务再次读取时会获得不同的值,如果在当前事务读取记录时就给该记录加锁,那么另一个事务就无法修改该记录,自然也不会产生不可重复读了。

幻读问题的产生是因为当前事务读取了一个范围的记录,然后另外的事务向该范围内插入新记录,当前事务再次读取该范围的记录时发现了新插入的新记录。采用加锁的方法解决幻读问题有一些麻烦,因为当前事务在第一次读取记录时幻影记录并不存在,所以读取的时候加锁就有点尴尬(因为你并不知道给谁加锁)。

小结:对比发现

  • 采用MVCC方式的话,读-写操作彼此并不冲突,性能更高。
  • 采用加锁方式的话,读-写操作彼此需要排队执行,影响性能。

一般情况下我们当然愿意采用MVCC来解决读-写操作并发执行的问题,但是业务在某些特性情况下,要求必须采用加锁的方式执行。

三、锁的不同角度分类

3.1 从数据操作的类型划分:读锁、写锁

对于数据库中并发事务的读-读情况并不会引起什么问题。对于写-写、读-写或写-读这些情况可能会引起一些问题,需要使用MVCC或者加锁的方式来解决他们。在使用加锁的方式解决问题时,由于既要允许读-读情况不受影响,又要使写-写、读-写或写-读情况中的操作相互阻塞,所以MySQL实现一个由两种类型的锁组成的锁系统来解决。这两种类型的锁通过被称为==共享锁(Shared Lock,S Lock)和排他锁(Exclusive Lock,X Lock),==也叫读锁(readLock)和写锁(write Lock)。

3.1.1 读锁/共享锁

英文用S表示,针对同一份数据,多个事务的读操作可以同时进行而不会互相影响,相互不阻塞的。

3.1.2 写锁/排它锁

英文用X表示,当前写操作没有完成前,它会阻断其他写锁和读锁。这样就能确保在给定的时间里,只有一个事务能执行写入,并防止其他用户读取正在写入的同一资源。

3.1.3 总结

需要注意的是对于InnoDB引擎来说,读锁和写锁可以加在表上,也可以加在行上。
在这里插入图片描述

  1. 锁定读
    在采用加锁方式解决脏读、不可重复读、幻读这些问题时,读取一条记录时需要获取该记录的S锁,其实是不严谨的,有时候需要在读取记录时就获取记录的X锁,来禁止别的事务读写该记录,为此MySQL提出了两种比较特殊的SELECT语句格式

    • 对读取的记录加S
      SELECT ... LOCK IN SHARE MODE#或
      SELECT ... FOR SHARE; #(8.0新增语法) 
      
    • 对读取的记录加X
      SELECT ... FOR UPDATE
    • MySQL 8.0 新特性
      在5.7及之前的版本,SELECT … FOR UPDATE,如果获取不到锁,会一直等待,直到innodb_lock_wait_timeout超时。在8.0版本中,SELECT… FOR UPDATE,SELECT … FOR SHARE添加,NOWAIT(会立即报错返回)、SKIP LOCKED(会立即返回,只是返回的结果中不包含被锁定的行)语法,跳过锁等待或者跳过锁定。
  2. 写操作
    平常所用到的写操作无非是:DELETE、UPDATE、INSERT这三种:

    • DELETE:
      对一条记录做DELETE操作的过程其实是先在B+树中定位到这条记录的位置,然后记录这条记录的X锁,再执行delete mark操作。我们也可以把这个定位待删除记录在B+树中位置的过程看成是一个获取X锁锁定读

    • UPDATE:在对一条记录做UPDATE操作时分为三种情况

      • 情况1:未修改该记录的键值,并且被更新的列占用的存储空间在修改前后未发生变化。
      • 情况2:未修改该记录的键值,并且至少有一个被更新的列占用的存储空间在修改前后发生变化。
      • 情况3:修改了该记录的键值,则相当于在原记录上做DELETE操作之后再来一次INSERT操作,加锁操作就需要按照DELETEINSERT的规则进行了。
    • INSERT:一般情况下,新插入一条记录的操作并不加锁,通过一种称之为隐式锁的结构来保护这条记录新插入的记录在本事务提交之前不被别的事务访问。

3.2 从数据操作的粒度划分:表级锁、页级锁、行锁

为了尽可能提高数据库的并发度,每次锁定数据的范围越小越好。理论上每次只锁定当前操作的数据的方案会得到最好的并发度,但是管理锁时很耗资源的事情(涉及获取、检查及释放锁等动作)。因此数据库系统需要在高并发响应系统性能两方面进行平衡;这样就产生了“锁粒度(Lock granularity)”的概念。

对一条记录加锁影响的也只是这条记录而已,我们就说这个锁的粒度比较细;其实一个事务也可以在表级别进行加锁,自然被称之为表级锁或者表锁,对一个表加锁影响整个表中的记录,我们就说这个锁的粒度比较粗。锁的粒度主要分为表级锁、页级锁和行锁。

3.2.1 表级锁

该锁会锁定整张表,它是MySQL中最基本的锁策略,并不依赖于存储引擎(不管你是MySQL的什么存储引擎,对于表锁的策略都是一样的),并且表锁时开销最小的策略(因为粒度比较大)。由于表级锁一次会将整个表锁定,所以可以很好的避免死锁问题。当然,锁的粒度大所带来最大的负面影响就是出现锁资源争用的概率也会最高,导致并发率大打折扣

  1. 表级别的S锁、X锁

    在对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,InnoDB存储引擎是不会为这个表添加表级别的S锁或者X锁的。在对某个表执行一些诸如ALTER TABLE、DROP TABLE 这类的DDL语句时,其他事务对这个表并发执行SELECT、INSERT、DELETE、UPDATE的语句会发生阻塞。同理,某个事务中对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,在其他会话中对这个表执行DDL语句也会发生阻塞。这个过程其实是通过在server层使用一种称之为元数据锁(英文名:Metadata Locks,简称MDL)结构来实现的。
    一般情况下,不会使用InnoDB存储引擎提供的表级别的S锁X锁。只会在一些特殊的情况下,比方说崩溃恢复过程中用到。比如,在系统变量autocomint = 0,innodb_table_locks =1 时, 手动获取InnoDB存储引擎提供的表t 的 S锁或者 X锁可以这么写:
    LOCK TABLES t READ:InnoDB存储引擎会对表t加表级别的S锁。
    LOCK TABLES t WRITE:InnoDB存储引擎会对表t加表级别的X锁。
    在这里插入图片描述

  2. 意向锁(intention lock)

    InnoDB支持多粒度锁(multiple granularity locking),它允许行级锁表级锁共存,而意向锁就是其中的一种表锁

    • 意向锁的存在是为了协调行锁和表锁的关系,支持多粒度(表锁与行锁)的锁并存。
    • 意向锁是一种不与行级锁冲突表级锁,这一点非常重要。
    • 表明“某个事务正在某些行持有了锁或该事务准备去持有锁。”

    意向锁分为两种:

    #意向共享锁(intention shared lock , IS):事务有意向对表中的某些行加共享锁(S锁)
    -- 事务要获取某些行的S锁,必须先获取表的IS锁。
    SELECT column FROM table .. LOCK IN SHARE MODE;
    
    # 意向排他锁(intention exclusive lock,IX):事务有意对表中的某些行加排他锁(X锁)
    -- 事务要获取某些行的X锁,必须先获得表的IX锁
    SELECT column FROM table ... FOR UPDATE;
    

    即:意向锁是由存储引擎自己维护的,用户无法手动操作意向锁,在为数据行加共享锁/排他锁之前,InnoDB会先获取该数据行所在数据表的对应意向锁

    意向锁要解决的问题:
    现在有练歌事务,分别是T1和T2,其中T2视图在该表级别上应用共享锁或排他锁,如果没有意向锁的存在,那么T2就需要去检查各个页或行是否存在锁;如果存在意向锁,那么此时就会受到T1控制的表级别意向锁的阻塞。T2在锁定该表前不必检查各个页或行锁,而只需检查表上的意向锁。简单来说就是给更大一级别的空间示意里面是否已经上过锁。
    在数据表的场景中,==如果我们给某一行数据加上了排它锁,数据库会自动给更大一级的空间,比如数据也或数据表加上意向锁,告诉其他人这个数据页或数据表已经有人上过排它锁了。==这样当其他人想要获取数据表排它锁的时候,只需要了解是否有人已经获取了这个数据表的意向排它锁即可。

    • 如果事务想要获取数据表中某些记录的共享锁,就需要在数据表上添加意向共享锁。
    • 如果事务想要获取数据表中某些记录的排它锁,就需要在数据表上添加意向排他锁。
      这时,意向锁会告诉其他事务已经有人锁定了表中的某些记录。

    在这里插入图片描述
    从上面的案例可以得到如下结论:

    • InnoDB支持多粒度锁,特定场景下,行级锁可以与表级锁共存。
    • 意向锁之间互不排斥,但除了IS与S兼容外,意向锁会与 共享锁/ 排它锁 互斥。
    • IX,IS是表级锁,不会和行级的X,S锁发生冲突。只会和表级的X、S发生冲突。
    • 意向锁在保证并发性的前提下,实现了行锁和表锁共存满足事务隔离性的要求。
  3. 自增锁(AUTO-INC锁)
    所有插入数据的方式总共分为三类,分别是Simple inserts,Bulk inserts 和 Mixed-mode inserts

    • Simple inserts(简单插入):可以预先确定要插入的行数(当语句被初始处理时)的语句,包括没有嵌套子查询的单行和多行INSERT… VALUES()和 REPLACE语句
    • Bulk inserts(批量插入):事先不知道要插入的行数(和所需自动递增值的数量)的语句。比如INSERT … SELECT,REPLACE … SELECT 和 LOAD DATA语句,但不包括纯 INSERT。InnoDB在每处理一行,为AUTO_INCREMENT列分配一个新值。
    • Mixed-mode inserts(混合模式插入):这些是“simple inserts”语句,但是指定部分新行的自动递增值。例如==INSERT INTO teacher (id,name) VALUES (1,‘a’),(null,‘b’),(5,‘c’);==只是指定了部分id的值。另一种类型的混合插入是 INSERT … ON DUPLICATE KEY UPDATE

    对于上述数据插入的案例,MySQL中采用了自增锁的方式来实现,AUTO-INC锁时当项使用含有AUTO_INCREMENT列的表中插入数据时需要获取的一种特殊的表级锁,在执行插入语句时就在表级别加一个AUTO-INC锁,然后为每条待插入记录的AUTO_INCREMENT修饰的列分配递增的值,在该语句执行结束后,再把AUTO-INC锁释放掉。一个事务在持有AUTO-INC锁的过程中,其他事务的插入语句都要被阻塞,可以保证一个语句中分配的递增值是连续的。也正因为此,其并发性显然不高,当我们向一个有AUTO_INCREMENT关键字的主键插入值的时候,每条语句都要对这个表锁进行竞争,这样的并发潜力其实是很低下的,所以innodb通过innodb_autoinc_lock_mode的不同值来提供不同的锁定机制,来显著提高SQL语句的可伸缩性和性能。

    innodb_autoinc_lock_mode有三种取值,分别对应不同模式:

    • 0:传统锁定模式
    • 1:连续锁定模式
    • 2:交错锁定模式
  4. 元数据锁(MDL锁)
    MySQL5.5 引入了meta data lock,简称MDK锁,属于表锁范畴。MDL的作用是,保证读写的正确性。因此,==当对一个表做增删改查操作的时候,加MDL读锁,当要对表做结构变更操作的时候,加MDL写锁。==读锁之间不互斥, 因此可以有多个线程同时对一张表增删改查。读写锁之间,写锁之间是互斥的,用来保证变更表结构操作的安全性,解决了DML和DDL操作之间的一致性问题。不需要显示使用,在访问一个表的时候会被自动加上。

3.2.2 行级锁

行锁(Row Lock)也称为记录锁,顾名思义,就是锁住某一行(某条记录row)。需要注意的是,MySQL服务器层并没有实现行锁机制,行级锁只在存储引擎层实现
优点: 锁定力度小,发生锁冲突概率低,可以实现的并发度高
缺点: 对于锁的开销比较大,加锁会比较慢,容易出现死锁情况。

InnoDB与MyISAM的最大不同有两点:

  • 支持事务(TrANSACTION)。
  • 采用了行级锁。

创建临时数据:
在这里插入图片描述
把B+数的索引结构做了一个超级简化,只把索引中的记录拿出来以便查看常用的行锁类型。

  1. Record Locks(记录锁)
    记录锁也就是仅仅把一条记录锁上,官方的类型名称为:LOCK_REC_NOT_GAP。比如我们把ID值为8的那条记录加一个记录锁的示意图如下图所示。仅仅是锁住了id值为8的记录,对周围的数据没有影响。
    在这里插入图片描述
    记录锁是由S锁和X锁之分的,称之为S型记录锁X型记录锁

    • 当一个事务获取了一条记录的S型记录锁后,其他事务也可以继续获取该记录的S型记录锁,但不可以继续获取X型记录锁。
    • 当一个事务获取了一条记录的X型记录锁后,其他事务既不可以获取该记录的S型记录锁,也不可以继续获取X型记录锁。
  2. Gap Locks(间隙锁)
    MySQL在REPEATABLE READ隔离级别下是可以解决幻读问题的,解决方案有两种,可以使用MVCC方案解决,也可以采用加锁方案解决。但是在使用加锁方案解决时有个大问题,就是事务在第一次执行读取操作时,那些幻影记录并不存在,我们无法给这些幻影记录加上记录锁。InnoDB提出了一种称之为Gap Locks的锁,官方的类型名称为:LOCK_GAP,我们可以简称为gap锁。如下,把id值为8的那条记录加一个gap锁的示意图:
    在这里插入图片描述
    图中的id值为8的记录加了gap锁,意味着不允许别的事务在id值为8的记录前边的间隙插入新记录,其实就是id列的值(3,8)这个区间的新记录不允许立即插入的。比如,有另外一个事务要想插入一条id值为4的新记录,它定位到该条记录的下一条记录的id值为8,而这条记录上又有一个gap锁,所以就会阻塞插入操作,知道拥有这个gap锁的事务提交之后,id列的值在区间(3,8)中的新记录才可以被插入。
    gap锁的提出仅仅是为了防止插入幻影记录而提出的。虽然有共享gap锁独占gap锁这样的说法,但是它们起到的作用是相同的。而且如果对一条记录加了gap锁(不论是共享gap锁还是独占gap锁),并不会限制其他事务对这条记录加记录锁或者继续加gap锁。
    注意,给一条记录加了gap锁只是不允许其他事务往这些记录前边的间隙插入新记录,那对于最后一条记录之后的间隙,也就是student表中id值为20的记录之后的间隙该咋办呢?也就是说给哪条记录加gap锁才能阻止其他事务插入id值在(20,+∞)这个区间的新记录呢?这时候就需要用到数据页中的两条伪记录。

    • Infimum记录,表示该页面中最小的记录。
    • Supermum记录,表示该页面中最大的记录。

    为了实现阻止其他事务插入id值在(20,+∞)这个区间的新记录,我们可以给索引中的最后一条记录,也就是id值为20的那条记录所在页面的Supermum记录加上一个gap锁,如图所示:
    在这里插入图片描述
    间隙锁的引入,可能会导致同样的语句锁住更大的范围,这其实是影响了并发度的。有可能产生死锁

  3. Next-Key Locks(临键锁)
    有时候我们既想锁住某条记录,又想阻止其他事务在该记录前边的间隙插入新记录,所以InnoDB就提出了一种称之为Next-key Locks的锁,官方的类型名称为:LOCK_ORDINARY,我们也可以简称为next-key锁。Next-Key Locks是在存储引擎 innodb、事务级别在可重复读的情况下使用的数据库锁,innodb默认的锁就是nex-key locks。比如把id值为8的那条记录加一个next-key锁的示意图如下:
    在这里插入图片描述
    next-key锁的本质就是一个记录锁和一个gap锁的合体,它既能保护该条记录,又能阻止别的事务将新记录插入被保护记录的前边的间隙。

    begin;
    select * from student where id <= 8 and id >3 for update;
    
  4. 插入意向锁(Insert Intention Locks)
    一个事务在插入一条记录时需要判断一下插入位置是不是被别的事务加了gap(next-key 锁也包含gap锁),如果有的话,插入记录需要等待,直到拥有gap锁的那个事务提交。但是InnoDB规定事务在等待的时候也需要在内存中生成一个锁结构,表明有事务向在某个间隙插入新记录,但是现在在等待。InnoDB就把这种类型的锁命名为Insert Intention Locks, 官方的类型名称为:LOCK_INSERT_INTENTION,我们称为插入意向锁。插入意向锁是一种Gap锁,不是意向锁,在insert操作时产生。
    插入意向锁是在插入一条记录行前,由INSERT 操作产生的一种间隙锁。该锁用以表示插入意向,当多个事务在同一区间(gap)插入位置不同的多条数据时,事务之间不需要互相对等待。假设存在两条值分别为4和7的记录,两个不同的事务分别试图插入值为5和6的两条记录,每个事务在获取插入行上独占的(排它)锁前,都会获取(4,7)之间的间隙锁,但是因为数据行之间并不冲突,所以两个事务之间并不会产生冲突(阻塞等待)。
    总结来说,插入意向锁的特性可以分为两部分:

    • 插入意向锁是一种特殊的间隙锁,间隙锁可以锁定开区间内的部分记录。
    • 插入意向锁之间互不排斥,所以即使多个事务在同一区间插入多条记录,只要记录本身(主键、唯一索引)不冲突,那么事务之间就不会出现冲突等待。

    注意:虽然插入意向锁中含有意向锁三个字,但是它并不属于意向锁而属于间隙锁,因为意向锁是表锁而插入意向锁是行锁
    比如,把id值为8的那条记录加一个插入意向锁的示意图如下:
    在这里插入图片描述
    插入意向锁并不会阻止别的事务继续获取该记录上任何类型的锁。

3.2.3 页级锁

页锁就是在页的粒度上进行锁定,锁定的数据资源比行锁要多,因为一个页中可以有多个行记录。当我们使用页锁的时候,会出现数据浪费的现象,但这样的浪费最多也就是一个页上的数据。页锁的开销介于表锁和行锁之间,会出现死锁。锁定粒度介于表锁和行锁之间,并发度一般。

每个层级的锁数量是有限制的,因为锁会占用内存空间,锁空间的内存大小是有限的。 当某个层级的锁数量超过了这个层级的阈值时,就会进行锁升级。锁升级就是用更大粒度的锁替代多个更小粒度的锁,比如InnoDB中行锁升级为表锁,这样做的好处是占用的锁空间降低了,但同时数据的并发度也下降了。

3.3 从对待锁的态度划分:乐观锁、悲观锁

从对待锁的态度来看锁的话,可以将锁分成乐观锁和悲观锁,从名字中可以看出这两种锁是两种看待数据并发的思维方式。需要注意的是,乐观锁和悲观锁并不是锁,而是锁的设计思想

3.3.1 悲观锁(Pessimistic Locking)

悲观锁是一种思想,顾名思义,就是很悲观,对数据被其他事务的修改持保守态度,会通过数据库自身的锁机制来实现,从而保证数据操作的排它性。
悲观锁总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会阻塞直到它拿到锁(共享咨询每次只给一个线程使用,其它线程阻塞,用完后再把资源转让给其他线程)。比如行锁,表锁,读锁、写锁等,都是在做操作之前先上锁,当其他线程想要访问数据时,都需要阻塞挂起。Java中synchronizedReentrantLock等独占锁就是悲观锁思想的实现。

select … for update是MySQL中悲观锁,在语句执行过程中所有扫描的行都会被锁上,因此在MySQL中用悲观锁必须确定使用了索引,而不是全表扫描,否则将会把整个表锁住。

悲观锁不适用的场景较多,它存在一些不足,因为悲观锁大多数情况下依靠数据库的锁机制来实现,以保障程序的并发访问性,同时这样对数据库性能开销影响也很大,特别是长事务而言,这样的开销往往无法承受,这时就需要乐观锁。

3.3.2 乐观锁

乐观锁认为对同一数据的并发操作不会总发生,属于小概率事件,不用每次都对数据上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,也就是不采用数据自身的锁机制,而是通过程序来实现。 在程序上,我们可以采用版本号机制或者CAS机制实现。乐观锁适用于多读的应用类型,这样可以提高吞吐量。 在Java中java.util.concurrent.atomic包下的原子变量类就是使用了乐观锁的一种实现方式:CAS实现的。

1. 乐观锁的版本号机制
在表中设计一个版本字段Version,第一次读的时候,会获取version字段的取值。然后对数据进行更新或删除操作时,会执行UPDATE … SET version = version +1 WHERE version = version; 此时如果已经有事务对这条数据进行了更改,修改就不会成功。
这种方式类似我们熟悉的SVN、CVS版本管理系统,当我们修改了代码进行提价时,首先会检查当前版本号预服务器上的版本号是否一致,如果一致就可以直接提交,如果不一致就需要更新服务器上的最新代码,然后再进行提交。

2. 乐观锁的时间戳机制
时间戳和版本号机制一样,也是在更新提交的时候,将当前数据的时间戳和更新之前取得的时间戳进行比较,如果两者一致则更新成功,否则就是版本冲突。

你能看到乐观锁就是程序员自己控制数据并发操作的权限,基本是通过给数据增加一个戳(版本号或者时间戳),从而证明当前拿到的数据是否更新。

注意: 如果数据表是读写分离的表,当master表中写入的数据没有及时同步到slave表中时,会造成更新一直失败的问题。此时需要强制读取master表中的数据(即将select语句放到事务中即可,这时候查询的就是master主库了)。

3.3.3 两种锁的适用场景

从这两种锁的设计思想中,我们总结一下乐观锁和悲观锁的适用场景:

  • 乐观锁适合读操作多的场景,相对来说写的操作比较少。它的优点在于程序实现,不存在死锁问题,不过适用场景也会相对乐观,因为它阻止不了除了程序以外的数据库操作。
  • 悲观锁适合写操作多的场景,因为写的操作具有排它性。采用悲观锁的方式,可以在数据库层面阻止其他事务对该数据的操作权限,防止读-写写-写的冲突。

总结如下图:
在这里插入图片描述

3.4 加锁方式

3.4.1 隐式锁

一个事务在执行INSERT操作时,如果即将插入的问题已经被其他事务加了gap锁,那么本次INSERT操作会阻塞,并且当前事务会在该间隙上加一个插入意向锁,否则一般情况下INSERT操作时不加锁的。那如果一个事务首先插入一条记录(此时并没有在内存生产与该记录关联的锁记录),然后另一个事务:

  • 立即使用SELECT … LOCK IN SHARE MODE语句读取这条记录,也就是获取这条记录的S锁,或者使用SELECT … FOR UPDATE语句读取纸条记录,也就是要获取这条记录的X锁,怎么办?
    如果允许这种情况的发生,那么可能产生脏读问题。
  • 理解修改这条记录,也就是要获取这条记录的X锁,怎么办?
    如果允许这种情况的发生,那么可能产生脏写问题。

这时候事务id起作用了。我们把聚簇索引和二级索引中的记录分开看下:

  • 情景一: 对于聚簇索引记录来说,有一个trx_id隐藏列,该隐藏列记录着最后改动该记录的事务id,那么如果在当前事务中新插入一条聚簇索引记录后,该记录的trx_id隐藏列代表的就是当前事务的事务id,如果其他事务此时想对该记录添加S锁或者X锁时,首先会看一下该记录的trx_id隐藏列代表的事务是否是当前的活跃事务,如果是的话,那么就帮助当前事务创建一个X锁(也就是为当前用户创建一个锁结构,is_waiting属性是false),然后自己进入等待状态(也就是为自己也创建一个锁结构,is_waiting属性是true)。
  • 情景二: 对于二级索引记录来说,本身并没有trx_id隐藏列,但是在二级索引页面的Page Header部分有一个PAGE_MAX_TRX_ID属性,该属性代表对该页面做改动的最大的事务id,如果PAGE_MAX_TRX_ID属性值小于当前最小的活跃事务id,那么说明对该页面做修改的事务都已经提交了,否则就需要在页面中定位到对应的二级索引记录,然后回表找到它对应的聚簇索引记录,然后再重复情景一的做法。

即:一个事务对一个新插入的记录可以不显式的加锁(生成一个锁结构),但是由于事务id的存在,相当于加了一个隐式锁。别的事务在堆这条记录加S锁或者X锁时,由于隐式锁的存在,会先帮助当前事务生成一个锁结构,然后自己再生成一个锁结构后进入等待状态。隐式锁是一种延迟加载的机制,从而减少了加锁的数量。

隐式锁在实际内存对象中并不含有这个锁信息。只有当产生锁等待时,隐式锁转化为显示锁。

隐式锁的逻辑过程如下:

  1. InnoDB的每条记录中都有一个隐含的trx_id字段,这个字段存在于聚簇索引的B+Tree中。
  2. 在操作一条记录前,首先根据记录中的trx_id检查该事务是否活动的事务(未提交或回滚)。如果是活动的事务,首先将隐式锁转换为显示锁(就是为该事务添加一个锁)。
  3. 检查是否有锁冲突,如果有冲突,创建锁,并设置为waiting状态,如果没有冲突不加锁,调到5。
  4. 等待加锁成功,被唤醒,或者超时。
  5. 写数据,并将自己的trx_id写入trx_id字段。

3.4.2 显示锁

通过特定的语句进行加锁,我们一般称之为显示加锁,例如:
显示加共享锁:

select ... lock in share mode;

显示加排它锁:

select ... for update;

3.5 其他

3.5.1 全局锁

全局锁就是对整个数据库实例加锁。当你需要让整个数据库处于只读状态的时候,可以使用这个命令,之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。全局锁的典型使用场景是:做全库逻辑备份。
全局锁的命令:

FLUSH tables with READ LOCK;

3.5.2 死锁

  • 概念: 死锁是指两个或多个事务在同一资源上相互占用,并请求锁定对方占用的资源,从而导致恶性循环。

  • 产生死锁的必要条件:

    • 两个或者两个以上事务
    • 两个事务都已经持有锁并且申请新的锁
    • 锁资源同时只能被同一个事务持有或者不兼容
    • 事务之间因为持有锁和申请锁导致彼此循环等待。

    死锁的关键在于:两个(或以上)的Session加锁的顺序不一致。

  • 如何处理死锁:

    • 方式一: 等待,直到超时(innodb_lock_wait_timeout = 50s)
      即当两个事务互相等待时,当一个事务等待时间超过设置的阈值时,就将其回滚,另外事务继续进行。这种方法简单有效,在InnoDB中,参数innodb_lock_wait_timeout用来设置超时时间。
      缺点: 对于在线服务来说,这个等待时间往往是无法接受的。
      那将此值修改短一些,比如1s,0.1s是否合适?不合适,容易误伤到普通的锁等待。
    • 方式二: 使用死锁检测进行死锁处理
      方式一检测死锁太过被动,InnoDB还提供了wait-for graph算法来主动进行死锁检测,每当加锁请求无法立即满足需要并进入等待时,wait-for graph算法都会被触发。
      这是一种较为主动的死锁检测机制,要求数据库保存锁的信息链表四五等待链表两部分信息。
      在这里插入图片描述
      基于这两个信息,可以绘制wait-fro graph(等待图)
      在这里插入图片描述

    死锁检测的原理是构建一个以事务为顶点,锁为边的有向图,判断有向图是否存在环,存在即有死锁。

    一旦检测到回路,有死锁,这时候InnoDB存储引擎会选择回滚undo量最小的事务,让其他事务继续执行(innodb_deadlock_detect = on 表示开启这个逻辑)。

    缺点: 每个新的被阻塞的线程,都要判断是不是由于自己的加入导致了死锁,这个操作时间复杂度是O(n)。如果100个并发线程同时更新一行,意味着要检测100*100 = 1万次,1万个线程就会有1千万次检测。

    解决方案:

    1. 关闭死锁检测,但意味着可能会出现大量的超时,会导致业务有损。
    2. 控制并发访问的数量。比如在中间件中实现对于相同行的更新,在进入引擎之前排队,这样在InnoDB内部就不会有大量的死锁检测工作。

    进一步的思路: 可以考虑通过将一行改成逻辑上的多行来减少锁冲突

  • 如何避免死锁:

    • 合理设计索引,使业务SQL尽可能通过索引定位更少的行,减少锁竞争。
    • 调整业务逻辑SQL执行顺序,避免update/delete长时间持有锁的SQL在事务前面。
    • 避免大事务,尽量将大事务拆成多个小事务来处理。小事务缩短锁定资源的时间,发生锁冲突的几率更小。
    • 在并发比较高的系统中,不要显式加锁,特别是在事务中显式加锁。如select … for update语句,如果是在事务里运行了start transaction或设置了 autocommit等于0,那么就会锁定所查找的记录。
    • 降低隔离级别,如果业务允许,将隔离级别调低也是比较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为gap锁造成的死锁。

四、锁结构

对一条记录加锁的本质就是在内存中创建一个锁结构与之关联,那么是不是一个事务对多条记录加锁,就要创建多个锁结构呢? 比如:

SELECT * FROM user LOCK IN SHARE MODE;

理论上创建多个锁结构没问题,但是如果一个事务要获取10000条记录的锁,生成10000个锁结构也太崩溃了!所以决定在对不同记录加锁时,如果符合下边这些条件的记录会放到一个锁结构中。

  • 在同一个事务中进行加锁操作。
  • 被加锁的记录在同一个页面中。
  • 加锁的类型是一样的。
  • 等待状态是一样的。

InnoDB存储引擎中的锁结构如下:
在这里插入图片描述
结构解析:
1. 锁所在的事务信息:
不论是表锁还是行锁,都是在事务执行过程中生成的,哪个事务生成了这个锁结构,这里就记录这个事务的信息。
此锁所在的事务信息在内存结构中只是一个指针,通过指针可以找到内存中关于该事务的更多信息,比方说事务id等。
2. 索引信息:
对于行锁来说,需要记录一下加锁的记录是属于哪个索引的。这里也是一个指针。
3. 表锁、行锁信息:
表锁结构和行锁结构在这个位置的内容是不同的:

  • 表锁:记载着是对哪个表加的锁,还有其他的一些信息

  • 行锁:记载了三个重要信息

    • Space ID:记录所在表空间
    • Page Number:记录所在页号
    • n_bits:对于行锁来说,一条记录就对应着一个比特位,一个页面中包含很多记录,用不同的比特位来区分到底是哪一条记录加了锁。为此在行锁结构的末尾防止了一堆比特位,这个n_bits属性代表使用了多少比特位。

    n_bits的值一般都比页面中记录条数多一些,主要是为了之后在页面中插入新记录后也不至于重新分配锁结构。

    • type_mode:这是一个32位的数,被分成了lock_mode、lock_typerec_lock_type三个部分,如图所示:
      在这里插入图片描述
      在这里插入图片描述在这里插入图片描述
  • 其他信息:为了更好的管理系统运行过程中生成的各种锁结构而设计了各种哈希表和链表。

  • 一堆比特位:如果是行锁结构的话,在该结构末尾还设置了一堆比特位,比特位的数量是由上边提高的n_bits属性表示的。InnoDB数据页中的每条记录在记录头信息中都包含一个heap_no属性,伪记录Infimum的heap_no值为0,Supermun的heap_no的值为1,之后每插入一条记录,heap_no的值就增1.锁结构最后的一堆比特位就对应着一个页面中的记录,一个比特位映射一个heap_no,即一个比特位映射到业内的一条记录。

五、锁监控

关于MySQL锁的监控,我们一般可以通过检查InnoDB_raw_lock等状态变量来分析系统上的行锁的争夺情况
在这里插入图片描述
对各个状态量的说明如下:

  • Innodb_row_lock_current_waits:当前正在等待锁定的数量;
  • Innodb_row_lock_time:从系统启动到现在锁定总时间长度(等待总时长)
  • Innodb_row_lock_time_avg:每次等待所花平均时间(等待平均时长)
  • Innodb_row_lock_time_max:从系统启动到现在等待最长的一次所花的时间
  • Innodb_row_lock_waits:系统启动后到现在总共等待的次数;(等待总次数)

尤其是当等待次数很高,而且每次等待时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手制定优化计划。

MySQL把事务和锁的信息记录在了information_schema库中,涉及到的三张表分别是:INNODB_TRX、INNODB_LOCKS和INNODB_LOCK_WAITS。

MySQL5.7及之前,可以通过information_schema.INNODB_LOCKS查看事务的锁情况,但只能看到阻塞事务的锁;如果事务并未被阻塞,则在该表中看不到该事务的锁情况。

MySQL8.0删除了information_schema.INNODB_LOCKS,添加了performance_schema.data_locks,可以通过performance_schema.data_locks查看事务的锁情况,和MySQL5.7及之前不同,performance_schema.data_locks不但可以看到阻塞该事务的锁,还可以看到该事务所持有的锁。

同时,information_schema.INNODB_LOCK_WAITS也被performance_schema.data_lock_waits所代替。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值