MySQL的索引,事务与存储引擎
1. 索引
1.1 概念
- 索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
- 建立索引的目的是加快对表中记录的查找或排序。
1.2 特点
1.2.1 优点
- 设置了合适的索引,数据库就能利用各种快速定位技术大大加快查询速度。
- 当表很大或查询涉及到多个表时,使用索引可以成千倍地提高查询速度。
- 可以降低数据库的IO成本和排序成本。
- 通过创建唯一(键)性索引,可以保证数据表中每一行数据的唯一性。
- 可以加快表与表之间的连接。
- 可大大提高分组和排序的效率。
1.2.2 缺点
-
索引需要占用额外的磁盘空间。
注:MyISAM引擎的索引文件与数据文件分离,索引文件用于保存数据记录的地址。 InnoDB引擎的表数据文件本身就是索引文件。
-
插入和修改数据因为索引的变动要花费更多的时间。
1.3 创建
在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行。因为索引本身会消耗系统资源,故如果使用不当,反而会增加数据库的负担。
1.3.1 原则
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是子表的主键,查询时可以快速定位。
- 记录数超过300行的表应该有索引。如果没有索引,需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其他表进行连接的表,应该在连接字段上建立索引。
- 唯一性太差的字段不适合建立索引。
- 更新太频繁的字段不适合创建索引。
- 经常出现在where子句中的字段,特别是大表的字段,应该建立索引。
- 索引应该建在选择性高的字段上。
- 索引应该建在小字段上,大的文本字段甚至超长字段不要建索引。
1.3.2 优化
MySQL的优化过程中,哪些字段/场景适合创建索引?
- 小字段
- 唯一性强的字段
- 更新不频繁,但查询率很高的字段
- 表记录超过300行
- 主键、外键、唯一键
1.4 分类
- 普通索引:最基本的索引类型,没有唯一性之类的限制。
- 唯一索引:与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
- 主键索引:是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
- 组合索引(单列索引与多列索引):可以是单列上创建的索引,也可以是在多列上创建的索引。因为select语句的where条件依次从左往右执行,所以需要满足最左原则。在使用select语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
- 全文索引(FULLTEXT):适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在MySQL 5.6版本以前,FULLTEXT索引仅可用于MyISAM引擎;在5.6版本之后innodb引擎也支持FULLTEXT索引。全文索引可以在CHAR、VARCHAR或者TEXT类型的列上创建。每个表只允许有一个全文索引。
2. 事务
2.1 概念
MySQL事务主要用于处理操作量大,复杂度高的数据。例如,在人员管理系统中要删除一个人员,既需要删除人员的基本资料,又需要删除和该人员相关的信息如信箱, 文章等等。这样,这些数据库操作语句就构成一个事务。
2.2 特征
- 事务是一种机制,一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求。
- 事务是一个不可分割的工作逻辑单元。在数据库系统上执行并发操作时,事务是最小的控制单元。
- 事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
- 事务通过事务的整体性以保证数据的一致性。
2.3 ACID
ACID是指在可靠的数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。
- 原子性:指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
- 一致性:指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
- 隔离性:指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
- 持久性:在事务完成以后,该事务对数据库所作的更改将持久的保存在数据库之中,不会被回滚。
2.4 隔离
2.4.1 级别
-
read uncommitted:不解决脏读,可读取尚未提交的数据。即使未提交,本事务也能看到修改后的数据值。也就是可能读取到其他会话中未提交事务修改的数据。
-
read committed:可以解决脏读,即只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别(不重复读)。
-
repeatable read:可以解决脏读和不可重复读。无论其他事务是否修改并提交了数据,在这个事务中看到的数据值始终不受其他事务影响
-
serializable:可以解决脏读,不可重复读和虚读(相当于锁表)。完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞。
注:mysql默认的事务处理级别是repeatable read ,而Oracle和SQL Server是read committed。
2.4.2 作用范围
事务隔离级别的作用范围分为两种——
全局级:对所有的会话有效
会话级:只对当前的会话有效
2.5 控制语句
BEGIN或START TRANSACTION:显式地开启一个事务。
COMMIT或COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
ROLLBACK或ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点(一个事务中可以有多个 SAVEPOINT)。“S1”代表回滚点名称。
ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
3. 存储引擎
3.1 概念介绍
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力。这些不同的技术以及配套的功能在MySQL中称为存储引擎。存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。