一、索引的介绍
## 1、索引的概念
·索引是一个排序的列表了在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(举似于C语言的表通过指针指向教据记录的内存地址)
·使用索引后可以不用扫播全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数掘,因此能加快教据库的查询速度
·索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
·索引是表巾一列或者若干列值排序的方法
·建立索引的目的是加快对表中记录的查找或排序。
2、索引的作用
设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
通过创建唯一性索引,可以保证数据表中每一行数据的唯一性。
可以加快表与表之间的连接。
在使用分组和排序时,可大大减少分组和排序的时间。
建立索引在搜索和恢复数据库中的数据时能显著提高性能
索引的副作用
索引需要占用额外的磁盘空间,更新包含索引的表效率会更慢
3、创建索引的原刚依据(面试题)
1)表中的记录行数较多时,一般超过300行的表建议要有索引
2)建议在 表中的主键字段、外键字段、多表连接使用的字段、唯一性较好的字段,不经常更新的字段、经常出现在where、group by、order by 子语句的字段、小字段 创建索引
3)不建议在 唯一性较差的字段、更新太频繁的字段、大文本字段 上创建索引
二、索引的分类和创建
创建一个表结构
create table member (id int(10),name varchar(10),cardid int(18),phone int 11),address varchar(50),remark text);
show creat table member;
1、普通索引
最基本的索引类型,没有唯一性之类的限制。
1、直接创建索引
create index 索引名 on 表名 (字段);
2、修改表的方式进行创建
alter table 表名 add index 索引名 (字段);
3、创建表的时候指定索引
create tables 表名 (字段1 数据类型,字段2 数据类型, ....), index 索引名 (列名);
2、唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
1、直接创建唯一索引
create unique index 索引名 on 表名 (字段);
alter table 表名 add unique 索引名 (字段);
3、主键索引
创建一个主键索引
4、组合索引
create unique index 索引名 on 表名 (字段1, 字段2, 字段3);
或者可以使用
lter table 表名 add index 索引名 (字段1, 字段2, 字段3);
select ... from 表名 where 字段1=XX and 字段2=xx and 字段3=XX
用 and 做条件逻辑运算符时,要创建组合索引且要满足最左原则
用 or 做条件逻辑运算符时,所有字段都要创建索引
5、全文索引
模糊查询
找到与这个字符相关的数据
6、查看索引
show create table 表名;
show index from 表名;
show keys from 表名;
7、删除索引
drop index 索引名 on 表名;
alter table 表名 drop index 索引名;
删除主键索引
alter table 表名 drop primary key;
8、分析是否使用索引
explain select … 可以用于分析select查询语句,看key字段,确定是否使用了索引或索引使用是否正确
explain 的相关参数
参数 | 解释 |
---|---|
possible_keys | 显示可能应用在这张表中的索引。 |
key | 实际使用的索引。如果为 NULL,则没有使用索引。 |
key_len | 使用的索引的长度。在不损失精确性的情况下,长度越短越好。 |
ref | 显示索引的哪一列被使用了,如果可能,则是一个常数。 |
Extra | 关于 MySQL 如何解析查询的额外信息。 |
explain select * from number;
分析select 查询的语句是否使用了索引
select查找速度慢怎么办(面试题)?
加上explain查看是否使用了索引,没有就alter添加索引
三、MySQL事务介绍
事务是一种机制。就是一组操作序列(包含1个或者多个操作命令),事务会把所有操作命令看作一个整体向系统提交或撤销操作,所有操作命令要么都执行,要么都不执行,它是一个不可分割的工作单位。
1、事务的ACID特性
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:
原子性(Atomicity)
一致性(Consistency)
隔离性(Isolation)
持久性(Durability)。
这是可靠数据库所应具备的几个特性。
原子性 | 事务管理的基础。把事务中的所有操作看作是一个不可分割的工作单元,要么都执行,要么都不执行 |
---|---|
一致性 | 事务管理的目的。保证事务开始前和事务结束后数据的完整和一致 |
隔离性 | 事务管理的手段。使多个事务并发操作同一个表数据时,每个事务都有各自的独立数据空间,可通过隔离级别解决不同的一致性问题 |
持久性 | 事务管理的结果。当事务被提交以后,事务中的操作命令修改的结果会被持久保存,且不会被回滚 |
●原子性
指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
事务是一个完整的操作,事务的各元素是不可分的。
事务中的所有元素必须作为一个整体提交或回滚。
如果事务中的任何元素失败,则整个事务将失败。
案例:A给B转帐100元钱的时候只执行了扣款语句,就提交了,此时如果突然断电,A账号已经发生了扣款,B账号却没收到加款,在生活中就会引起纠纷。这种情况就需要事务的原子性来保证事务要么都执行,要么就都不执行。
●一致性
指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
当事务完成时,数据必须处于一致状态。
在事务开始前,数据库中存储的数据处于一致状态。
在正在进行的事务中,数据可能处于不一致的状态。
当事务成功完成时,数据必须再次回到已知的一致状态。
案例:对银行转帐事务,不管事务成功还是失败,应该保证事务结束后表中A和B的存款总额跟事务执行前一致。
●隔离性
指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。
●持久性
在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
指不管系统是否发生故障,事务处理的结果都是永久的。
一旦事务被提交,事务的效果会被永久地保留在数据库中。
总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果。
2、隔离性 — 不一致的现象
在多个事务并发操作同一个表数据时,不同的隔离级别可能会出现的一致性问题:
脏读 | 一个事务可以看到另一个事务没有提交的修改数据 |
---|---|
不可重复读 | 在一个事务里的两次查询会看到数据不一致的情况,这种情况可能因为两次查询过程中间有其它事务修改了数据并已提交 |
幻读 | 在一个事务里的两次查询会看到数据不一致的情况(可能是发现之前没有的数据),这种情况可能因为两次查询过程中间有其它事务插入了新的数据并已提交 |
丢失更新 | 一个事务修改数据并提交可能会覆盖另一个事务修改和提交的数据 |
脏读
当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
不可重复读
指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。
那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。
这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容)
幻读
一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。
同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。
那么,操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。
丢失更新
两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
3、隔离性 ———隔离级别
事务的隔离级别决定了事务之间可见的级别。
MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它并发的事务:
隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
未提交读 Read Uncommitted RU 【最低隔离】 | 可以 | 可以 | 可以 |
提交读 Read Committed RC | 不可以 | 可以 | 可以 |
可重复读 Repeatable Read RR | 不可以 | 不可以 | 对lnnodb 不允许,对有条件的允许 |
串行读 Serializable (相当于表级锁定,会影响数据库读写效率和性能)【最高隔离】 | 不可以 | 不可以 | 不可以 |
未提交读(Read Uncommitted(RU)
不做任何隔离操作
允许脏读,即允许一个事务可以看到其他事务未提交的修改。
提交读 Read Committed(RC) ---Oracle和SQL Server默认的隔离级别
会话2未提交的修改会话1不可见
允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。防止脏读。
可重复读 Repeatable Read(RR) ---mysql默认的隔离级别
不允许会话2更改会话1正在操作的那行数据
确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。可以防止脏读和不可重复读。
串行读 Serializable ---相当于锁表
直接锁表,防止会话2上方插入行 影响会话1下方读取行
完全串行化的读,将一个事务与其他事务完全地隔离。每次读都需要获得表级共享锁,读写相互都会阻塞。可以防止脏读,不可重复读取和幻读,(事务串行化)会降低数据库的效率。
事务隔离级别的作用范围分为两种
●global 全局级 所有会话有效 重新会话生效
●session 会话级 当前会话有效 立刻生效
查看全局事务隔离级别
show global variables like '%isolation%';
show session variables like '%isolation%';
设置全局事务隔离级别
set global transaction isolation level read committed;
set session transaction isolation level read committed; #重新启动服务后生效
方法二
set @@global.tx_isolation='repeatable-read';
查询会话事务隔离级别
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
设置会话事务隔离级别
set session transaction isolation level repeatable read;
set @@session.tx_isolation='repeatable-read';
方法一
方法二
总结:在事务管理中,原子性是基础,隔离性是手段,一致性是目的,持久性是结果
4、事务控制语句
开启事务
BEGIN 或 START TRANSACTION
显式地开启一个事务。
提交事务
COMMIT 或 COMMIT WORK
提交事务,并使已对数据库进行的所有修改变为永久性的。
回退事务
ROLLBACK 或 ROLLBACK WORK
回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
创建回滚点
SAVEPOINT S1
使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
回退到回滚点
ROLLBACK TO [SAVEPOINT] S1
把事务回滚到标记点。
5、实验操作
创建一个表结构进行实验
create table account(
-> id int (10) primary key not null,
-> name char (20) ,
-> money double
-> );
5.1、测试提交事务
修改表里面的数据,进行测试
begin;
update account set money=money+100 where name='A';
使用提交事务的命令进行验证
commit
5.2、测试回滚事务
5.3、测试多点回滚
测试回滚
6、使用set 设置控制事务
SET AUTOCOMMIT=0; #禁止自动提交
SET AUTOCOMMIT=1; #开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT'; #查看Mysql中的AUTOCOMMIT值
如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit|rollback; 都是独立的事务。
举例
四、MySQL 存储引擎
4.1、存储引擎概念
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎。
存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。Mysql常用的存储引擎是MyISAM、InnoDB。
MySQL数据库中的组件,负责执行实际的数据I/O操作。MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。
4.2、常用的存储引擎
MyISAM:不支持事务、外键约束,只支持表级锁定,适合单独的查询或插入操作,读写并发能力较弱,支持全文索引,资源占用较小,数据文件(.MYD)和索引文件(.MYI)是分开存储的。
推荐使用场景:适用于不需要事务处理,单独的查询或者插入数据的业务场景
InnoDB:支持事务、外键约束,支持行级锁定(在全表扫描时仍然会表级锁定),读写并发能力较好,支持全文索引(5.5版本以后的),缓存能力较好可以减少磁盘IO的压力,数据文件也是索引文件。
推荐使用场景:适用于需要事务的支持,一致性要求较高,数据会频繁更新,高并发读写的业务场景
4.3.1、MylSAM 表的存储格式
(1)静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
(2)动态表
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
(3)压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
4.3.2、MyISAM 适用的生产场景
公司业务不需要事务的支持;
单方面读取或写入数据比较多的业务;
MyISAM存储引擎数据读写都比较频繁场景不适合;
使用读写并发访问相对较低的业务;
数据修改相对较少的业务;
对数据业务一致性要求不是非常高的业务;
服务器硬件资源相对比较差。
4.4、InnoDB 的概念
4.4.1、InnoDB 的特点介绍
MySQL从5.5.5版本开始,默认的存储引擎为 InnoDB。支持外键约束,5.5前不支持全文索引,5.5后支持全文索引。InnoDB支持分区、表空间,类似oracle数据库。
事务型数据库的首选引擎,支持4个事务隔离级别,读写阻塞与事务隔离级别相关。支持行级锁定,但是全表扫描仍然会是表级锁定,如 update table set a=1 where user like ‘%lic%’; 。表与主键以簇的方式存储。InnoDB能非常高效的缓存索引和数据,对硬件资源要求还是比较高的场合。
InnoDB 中不保存表的行数,如 select count() from table; 时,InnoDB 需要扫描一遍整个表来计算有多少行,但是 MyISAM 只要简单的读出保存好的行数即可。需要注意的是,当 count()语句包含 where 条件时 MyISAM 也需要扫描整个表。
对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM 表中可以和其他字段一起建立组合索引。
清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重建表。
4.4.2、InnoDB 使用生产场景
业务需要事务的支持;
行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成;
业务数据更新较为频繁的场景,如:论坛,微博等;
业务数据一致性要求较高,如:银行业务;
硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力。
4.4.3、企业选择存储引擎的依据
需要考虑每全存储引擎提供了哪些不同的核心功能及应用场景。
支持的字段和数据类型。所有引擎都支持通用的数据类型,但不是所有的引擎都支持其它的字段类型,如二进制对象。
锁定类型:不同的存储引擎支持不同级别的锁定。例如表锁定:MylSAM支持;行锁定:InnoDB支持
索引的支持。建立索引在搜索和恢复数据库中的数据时能显著提高性能,不同的存储引擎提供不同的制作索引的技术,有些存储引擎根本不支持索引。
事务处理的支持。提高在向表中更新和插入信息期间的可靠性,可根据企业业务是否要支持事务选择存储引擎
4.5、MyISAM 和 InnoDB 的区别
MylSAM | lnnoDB | |
---|---|---|
构成上区别 | 数据文件(.MYD)和索引文件(.MYI)是分开存储的 | 数据文件也是索引文件 |
事务处理方面 | 不支持事务、外键约束 | 支持事务、外键约束 |
锁定 | 支持表级锁定 | 支持行级锁定(在全表扫描时仍会表级锁定) |
支持的操作 | 适合单独的查询或插入操作,支持全文索引 | 支持全文索引(5.5版本以后的) |
读写能力 | 读写并发起能力较弱 | 读写并发能力较好 |
特点 | 资源占用较小 | 缓存能力较好,可以减少此怕你IO的压力 |
适用场景 | 适用于不需要书屋处理适用与单独的查询或者插入数据的业务场景 | 适用于需要事务的支持适用一致性要求高,数据会频繁更新、高并发读写的业务场景 |
4.6、存储引擎管理
4.6.1、查看系统支持的存储引擎
show engines;
4.6.2、查看表使用的存储引擎
方法一:
show table status from 库名 where name='表名'\G
方法二:
use 库名;
show create table 表名;
方法一
方法二
4.7、修改存储引擎
1.通过 alter table 修改
use 库名;
alter table 表名 engine=MyISAM;
2.通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysqld]
......
default-storage-engine=INNODB
systemctl restart mysql.service
注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
3.通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;
方法一
方法二
方法三
五、InnoDB 行锁与索引的关系
InnoDB行锁是通过给索引项加锁来实现的,如果没有索引,InnoDB将通过隐藏的聚簇索引来对记录加锁。
1)
delete from t1 where id=1;
如果id字段是主键,innodb对于主键使用了聚簇索引,会直接锁住整行记录。
2)
delete from t1 where name='aaa';
如果name字段是普通索引,会先锁住索引的两行,接着会锁住相应主键对应的记录。
3)
delete from t1 where age=23;
如果age字段没有索引,会使用全表扫描过滤,这时表上的各个记录都将加上锁。
六、死锁
6.1、死锁的概念
死锁是指两个或多个事务在同一资源上相互占用,并请求锁定对方的资源,从而导致恶性循环的现象。常见的解决死锁的方法如果不同程序会并发存取多个表,尽量约定以相同的顺序访问表,可以大大降低死锁机会
死锁一般是事务相互等待对方资源,最后形成环路造成的。
在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁产生概率。
使用InnoDB!MyISAM不支持事务
删除数据,模拟死锁
总结:对没有使用索引的字段进行操作,整个表会被锁定;对有使用索引的字段进行操作,只会锁定相关行。
for update 可以为数据库中的行上一个排它锁。当一个事务的操作未完成时候,其他事务可以读取但是不能写入或更新
共享锁:又叫做读锁,当用户要进行数据的读取时,对数据加上共享锁,共享锁可以同时加上多个。
排他锁:又叫做写锁,当用户要进行数据的写入时,对数据加上排他锁,排他锁只可以加一个,它和其它的排他锁,共享锁都相斥。
6.2、如何解决死锁
使用更合理的业务逻辑,以固定的顺序访问表和行。
大事务拆小。大事务更倾向于死锁,如果业务允许,将大事务拆小
在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率。
降低隔离级别。如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RZ调整为RC,可以避免掉很多因为zap锁造成的死锁。
为表添加合理的索引。如果不使用索引将会为表的每一行记录添加上锁,死锁的概率大大增大。