小白零基础,详细教程一看就能学会,索引、事务和锁

索引、事务和锁

课程说明

本课程采用 MySQL5.7 版本,并采用 InnoDB 存储引擎

一、索引

1、索引简介

1) 什么是索引?
一般的应用系统,读写比例在 10:1 左右,而且插入操作和一般的更新操作很少出现性能问题,在生产环境中,我们遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,因此对查询语句的优化显然是重中之重。
说起加速查询,就不得不提到索引了。
2) 为什么要有索引?
索引在 MySQL 中也叫做“键”,是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能非常关键,尤其是当表中的数据量越来越大时,索引对于性能的影响愈发重要。
索引优化应该是对查询性能优化最有效的手段了。善用索引能够轻易将查询性能提高好几个数量级。
索引相当于字典的音序表,如果要查某个字,如果不使用音序表,则需要从几百页中逐页去查。
3) 索引的优劣势:
索引的优势:可以快速检索,减少 I/O 次数,加快检索速度;根据索引分组和排序,可以加快分组和排序。
索引的劣势:索引本身也是表,因此会占用存储空间,一般来说,索引表占用的空间是数据表的 1.5 倍;
索引表的维护和创建需要时间成本,这个成本随着数据量增大而增大;构建索引会降低数据表的修改操作(删除,添加,修改)的效率,因为在修改数据表的同时还需要修改索引表。

2、MySQL 中索引的使用

1) 创建索引
索引可以在创建表时创建,也可以在创建表之后添加。
在创建表时创建索引,代码如下所示:

CREATE TABLE mytable(
ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX myindex (username(16))
);

语法解析:代码中的 index 表示索引,myindex 表示定义的索引名称。

注意:如果是 CHAR,VARCHAR 类型,length 可以小于字段实际长度;如果是 BLOB 和 TEXT 类型,必须指定 length。

查看索引

创建索引后可以使用下面语句查看索引。

SHOW INDEX FROM mytable

删除索引

删除索引可以使用 drop 或者 alter 命令来完成。
删除表中索引,代码如下所示:

DROP INDEX myindex ON mytable;
或者
ALTER TABLE mytable DROP INDEX myindex;

语法分析:代码中的 myindex 是创建索引时定义的索引名称。

通过 EXPLAIN 分析 SQL 是否使用到索引

通过 explain 命令查看索引使用情况,代码如下所示:

explain select * from mytable where username = 'jack'

运行结果如下:

注意:如果 key 值为索引名称,则该查询使用了索引,如果 key 值为 null,则表示没有使用索引。

索引的使用规则

1) 索引分类

常见的索引类型有:主键索引、唯一索引、普通索引、全文索引、组合索引。
主键索引:即主索引,根据主键 pk_clolum(length)建立索引,不允许重复,不允许空值;
唯一索引:用来建立索引的列的值必须是唯一的,允许空值;
普通索引:用表中的普通列构建的索引,没有任何限制;
全文索引:用大文本对象的列构建的索引;
组合索引:用多个列组合构建的索引,这多个列中的值不允许有空值。

2) 适合建立索引的情况

主键自动建立唯一索引;
经常作为查询条件在 WHERE 或者 ORDER BY 语句中出现的列要建立索引;
作为排序的列要建立索引;
查询中与其他表关联的字段,外键关系建立索引;
高并发条件下倾向组合索引;
用于聚合函数的列可以建立索引,例如使用了 max(column_1)或者 count(column_1)时的 column_1 就需要建立索引。

3) 不适合建立索引的情况

经常增删改的列不要建立索引;
有大量重复的列不建立索引;
表记录太少不要建立索引。只有当数据库里已经有了足够多的测试数据时,它的性能测试结果才有实际参考价值。如果在测试数据库里只有几百条数据记录,它们往往在执行完第一条查询命令之后就被全部加载到内存里,这将使后续的查询命令都执行得非常快–不管有没有使用索引。只有当数据库里的记录超过了 1000 条、数据总量也超过了 MySQL 服务器上的内存总量时,数据库的性能测试结果才有意义。

4) 索引失效的情况

在组合索引中不能有列的值为 NULL,如果有,那么这一列对组合索引就是无效的;
在一个 SELECT 语句中,索引只能使用一次,如果在 WHERE 中使用了,那么在 ORDER BY 中就不要用了;
LIKE 操作中,’%aaa%'不会使用索引,也就是索引会失效,但是‘aaa%’可以使用索引;
在索引的列上使用表达式或者函数会使索引失效;
在查询条件中使用不等于,包括<符号、>符号和!=会导致索引失效;
在查询条件中使用 IS NULL 或者 IS NOT NULL 会导致索引失效;
字符串不加单引号会导致索引失效;
在查询条件中使用 OR 连接多个条件会导致索引失效,除非 OR 链接的每个条件都加上索引;
如果排序的字段使用了索引,那么 select 的字段也要是索引字段,否则索引失效;
尽量不要包括多列排序,如果一定要,最好为这队列构建组合索引。
具体查看索引是否有效,可以使用 explain 命令查询。

事务

1、事务简介

1) 什么是事务?
事务(Transaction):一个最小的不可再分的工作单元;通常一个事务对应一个完整的业务(例如银行账户转账业务,该业务就是一个最小的工作单元)。
事务只和 DML 语句有关,或者说 DML 语句才有事务。
2) 转账操作理解事务
以下是银行账户表 t_act(账号、余额),进行转账操作。

actnobalance
1500
2100

使用 update 语句实现转账操作,实现账号 1 向账号 2 转账 100 元。

分析:转账操作,需要账号 1 余额减少 100 元,同时需要账号 2 余额增加 100 元。代码如下所示:

update t_act set balance=balance-100 where actno=1;
update t_act set balance=balance+100 where actno=2;

在一个转账业务中,以上两条 DML 语句必须同时成功或者同时失败。最小单元不可再分,当第一条 DML语句执行成功后,并不能将底层数据库中的第一个账户的数据修改,只是将操作记录了一下;这个记录是在内存
中完成的;当第二条 DML 语句执行成功后,和底层数据库文件中的数据完成同步。若第二条 DML 语句执行失败,则清空所有的历史操作记录,要完成以上的功能必须借助事务。

2、MySQL 中事务的使用

在 mysql 中,事务的常规操作包括:开启事务、提交事务与回滚事务。

  1. 开启事务
    开启事务的语法如下所示:
start transaction;
或者
begin transaction;
  1. 提交事务
    提交事务的语法如下所示:
commit;
  1. 回滚事务
    回滚事务的语法如下所示:
rollback;

手动开启事务,向 t_act 表中插入一行记录,提交事务。代码如下所示:

start transaction;-- 手动开启事务
insert into t_act values(3,300); -- 更新操作
commit;-- 提交事务,commit 之后即改变底层数据库数据
select * from t_act;

运行结果如下:

看到这个结果,似乎和直接执行插入一条记录没什么不同。确实,在 MySQL 中,默认情况下,事务是自动提交的,也就是说,只要执行一条 DML 语句就开启了事务,并且提交了事务。

手动开启事务,向 t_act 表中插入一行记录,回滚事务。代码如下所示:

start transaction;-- 手动开启事务
insert into t_act values(4,200); -- 更新操作
rollback;-- 回滚事务
select * from t_act;

运行结果如下:

从运行结果中可以看到,回滚事务会撤销更新操作,代码执行前后数据表中的数据没有发生任何变化。

事务的特征

事务四大特征(ACID):

1,原子性(A):事务是最小单位,不可再分;
2, 一致性©:事务要求所有的 DML 语句操作的时候,必须保证同时成功或者同时失败;
3, 隔离性(I):同一时间,只允许一个事务请求同一数据,不同的事务之间彼此没有任何干扰;
4, 持久性(D):是事务的保证,事务终结的标志(内存的数据持久到硬盘文件中)。

事务的隔离级别

事务的隔离级别有 4 个:

1,读未提交(read uncommitted):事务 A 和事务 B,事务 A 未提交的数据,事务 B 可以读取到,这里读取到的数据叫做“脏数据”。这种隔离级别最低,一般是在理论上存在,数据库隔离级别一般都高于该级别;
2,读已提交(read committed):事务 A 和事务 B,事务 A 提交的数据,事务 B 才能读取到。这种隔离级别高于读未提交,可以避免“脏数据”。但如果事务 A 多次读取同一数据,而事务 B 在事务 A 多次读
取的过程中,对数据作了更新并提交,导致事务 A 多次读取同一数据时,结果不一致,这种现象称为“不可重复读”;
3,可重复读(repeatable read):事务 A 和事务 B,事务 A 提交之后的数据,事务 B 读不到事务 A 提交的数据。这种隔离级别高于读已提交,但如果事务 A 在修改数据的过程中(比如将所有记录状态设为1),
如果事务 B 向同一张表中插入一条新记录(状态为 0),事务 A 提交后再次查询表,会发现有一条记录状态没有改成 1,好像发生了幻觉,这种现象称为“幻读”。可重复读是 MySQL 默认隔离级别;
4,串行化(serializable):事务 A 和事务 B,事务 A 在操作数据库时,事务 B 只能排队等待。这种级别可以避免“幻读”,每一次读取的都是数据库中真实存在数据,事务 A 与事务 B 串行,而不并发。
事务隔离级别与一致性的关系也可以用下表表示:

打开两个客户端,分别开启两个事务,验证“读未提交”事务隔离级别与一致性关系。
打开客户端 A,操作如下图所示:

打开客户端 B,操作如下图所示:

回到客户端 A,重新查询表,发现账户 1 的余额发生了变化,如下图所示:

这时,虽然客户端 B 的事务还没提交,但是客户端 A 就可以查询到 B 已经更新的数据,一旦客户端 B 的事务因为某种原因回滚,所有的操作都将会被撤销,那客户端 A 查询到的数据其实就是脏数据。
在客户端 B 回滚事务,如下图所示:

此时,在客户端 A 执行:update t_act set balance = balance-50 where actno = 1;语句,账户 1 的余额应该变成多少呢?

从上图中,我们看到数据不一致,因为客户端 A 更新时并不知道其他事务回滚了,想解决这个问题可以采用读已提交的隔离级别。

锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(如 CPU、RAM、I/O 等)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库显得尤其重要,也更加复杂。本节我们着重讨论 MySQL 锁机制的特点,常见的锁问题,以及解决 MySQL 锁问题的一些方法或建议。

1、乐观锁

乐观锁不是数据库自带的,需要我们自己去实现。乐观锁是指操作数据库时(更新操作),想法很乐观,认为这次的操作不会导致冲突,在操作数据时,并不进行任何其他的特殊处理(也就是不加锁),而在进行更新后,再去判断是否有冲突了。
通常实现是这样的:在表中的数据进行操作时(更新),先给数据表加一个版本(version)字段,每操作一次,将那条记录的版本号加 1。也就是先查询出那条记录,获取出 version 字段,如果要对那条记录进行操作(更新),则先判断此刻 version 的值是否与刚刚查询出来时的 version 的值相等,如果相等,则说明这段期间,没有其他程序对其进行操作,则可以执行更新,并将 version 字段的值加 1;如果更新时发现此刻的 version值与刚刚获取出来的 version 的值不相等,则说明这段期间已经有其他程序对其进行操作了,则不进行更新操作。
除了自己手动实现乐观锁之外,现在许多框架已经封装好了乐观锁的实现,如 hibernate 或 JPA,需要时,可自行百度搜索“hibernate 乐观锁”试试看。

2、悲观锁

与乐观锁相对应的就是悲观锁了。悲观锁就是在操作数据时,认为此操作会出现数据冲突,所以在进行每次操作时都要通过获取锁才能进行对相同数据的操作,这点跟 java 中的 synchronized 很相似,所以悲观锁需要耗费较多的时间。另外与乐观锁相对应的,悲观锁是由数据库自己实现了的,要用的时候,我们直接调用数据库的相关语句就可以了。
MySQL 中锁的实现主要有两种:共享锁(S)与排它锁(X),它们分别对应数据的读和写操作。

1) 共享锁与排它锁

共享锁(S):也称为读锁,允许事务读取一行数据。例如事务 T 对数据对象 A 加上 S 锁,则事务 T 可以读 A但不能修改 A,其他事务只能再对 A 加 S 锁,而不能加 X 锁,直到 T 释放 A 上的 S 锁。这保证了其他事务可以读A,但在 T 释放 A 上的 S 锁之前不能对 A 做任何修改。
排它锁(X):也称写锁,允许事务删除或更新一行数据。例如事务 T 对数据对象 A 加上 X 锁,事务 T 可以读A 也可以修改 A,其他事务不能再对 A 加任何锁,直到 T 释放 A 上的锁。
**注意:**共享锁之间是兼容的,而排它锁与其他任意锁都不兼容。因此我们在数据库中可以并行读,但只能串行写,只有这样才不会发生线程竞争。

2) 锁的粒度

锁的粒度就是你要锁定的范围是多大。使用锁时,锁定的东西越少,对其他竞争者影响越小,这个东西的大小就是锁粒度。
例如卫生间里的洗漱台,马桶,浴缸,如果分别隔开(三个区域可以分别锁定,粒度小),就可以同时给三个人使用。你关上浴室的门,别人还是可以洗手的;但如果卫生间的区域不隔开,一个人进卫生间锁上门,其他人就进不去了。可见,锁的粒度越小,锁定的资源越少,对其他用户的影响就越小,当然,对系统的开销也越大。
锁的粒度分类:

表级锁:开销小,加锁快,不会出现死锁。锁定粒度最大,适合查询为主的,只有少量按索引条件更新数据的操作。缺点是资源争用概率高;
行级锁:开销大,加锁慢,会出现死锁。锁定粒度最小,适合大量按索引条件并发更新少量不同数据,同时又有并发查询的操作。使用行级锁定的主要是 InnoDB 存储引擎;
页面锁:开销介于表锁与行锁之间,会出现死锁。

**提示:**因为悲观锁是由数据库实现的,一般不需要开发人员操作,我们只需要了解锁的作用与分类以及锁和事务的关系就可以了。想学习更多有关锁的知识请分别百度搜索“数据库锁”“MySQL 锁”。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值