目录
引言
在企业信息化的过程中,数据库中表的数据量越来越大,性能会急剧下降,创建索引对于保持良好的性能非常关键。索引是对查询性能优化最有效的手段,能够轻易将查询性能提高几个数量级。执行数据库操作,有时需要多个操作表示一个操作流程,要么都执行,要么都不执行,这就是数据的事务。
一、索引的概念
1、数据库索引
(1)索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链表通过指针指向数据记录的内存地址)。
(2)使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
(3)索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
(4)索引是表中一列或者若干列值排序的方法。
(5)建立索引的目的是加快对表中记录的查找或排序
2、索引的作用
(1)设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
(2)当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
(3)可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本。
(4)通过创建唯一(键)性索引,可以保证数据表中每一行数据的唯一性。
(5)可以加快表与表之间的连接。
(6)在使用分组和排序时,可大大减少分组和排序的时间。
3、索引的副作用
(1)索引需要占用额外的磁盘空间。
对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址。而InnoDB引擎的表数据文件本身就是索引文件。
(2)在插入和修改数据时要花费更多的时间,因为索引也要随之变动。
4、创建索引的原则依据
索引虽可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源,在有索引的情况下,数据库会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是子表的主键,查询时可以快速定位
(1)记录数超过300行的表应该有索引。如果没有索引,需要把表遍历一遍,会严重影响数据库的性能。
(2)经常与其他表进行连接的表,在连接字段上应该建立索引。
(3)唯一性太差的字段不适合建立索引。
(4)更新太频繁地字段不适合创建索引。
(5)经常出现在 where 子句中的字段,特别是大表的字段,应该建立索引。
(6)索引应该建在选择性高的字段上。
(7)索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引。
二、索引的分类和创建
1、普通索引
最基本的索引类型,没有唯一性之类的限制。
(1)直接创建索引
格式:CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项。如果忽略 length 的值,则使用整个列的值作为索引。如果指定使用列前的 length 个字符来创建索引,这样有利于减小索引文件的大小。
#索引名建议以“_index”结尾。
(2)修改表方式创建
格式:ALTER TABLE 表名 ADD INDEX 索引名 (列名);
(3)创建表的时候指定索引
格式:CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
2、唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
(1)直接创建唯一索引
格式:CREATE UNIQUE INDEX 索引名 ON 表名(列名);
(2)修改表方式创建
格式:ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
(3)创建表的时候指定
格式:CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
3、主键索引
是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。 添加主键将自动创建主键索引。
(1)创建表的时候指定
格式:CREATE TABLE 表名 ([...],PRIMARY KEY (列名));
(2)修改表方式创建
格式:ALTER TABLE 表名 ADD PRIMARY KEY (列名);
4、组合索引(单列索引与多列索引)
可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的 where条件是依次从左往右执行的,所以在使用select 语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
格式:CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
格式:select * from 表名 where 列名1='...' AND 列名2='...' AND 列名3='...';
5、全文索引(FULLTEXT)
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。每个表只允许有一个全文索引。
(1)直接创建索引
格式:CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
(2)修改表方式创建
格式:ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
(3)创建表的时候指定索引
格式:CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
#数据类型可以为 CHAR、VARCHAR 或者 TEXT
(4)使用全文索引查询
格式:SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
6、查看索引
show index from 表名;
show index from 表名\G; 竖向显示表索引信息
show keys from 表名;
show keys from 表名\G;
名称 | 含义 |
Table | 表的名称。 |
Non_unique | 如果索引内容唯一,则为 0;如果可以不唯一,则为 1。 |
Key_name | 索引的名称。 |
Seq_in_index | 索引中的列序号,从 1 开始。 limit 2,3 |
Column_name | 列名称。 |
Collation | 列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。 |
Cardinality | 索引中唯一值数目的估计值。 |
Sub_part | 如果列只是被部分地编入索引,则为被编入索引的字符的数目(zhangsan)。如果整列被编入索引,则为 NULL。 |
Packed | 指示关键字如何被压缩。如果没有被压缩,则为 NULL。 |
Null | 如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。 |
Index_type | 用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。 |
Comment | 备注。 |
7、删除索引
(1)直接删除索引
格式:DROP INDEX 索引名 ON 表名;
(2)修改表方式删除索引
格式:ALTER TABLE 表名 DROP INDEX 索引名;
(3)删除主键索引
格式:ALTER TABLE 表名 DROP PRIMARY KEY;
三、MySQL事务
1、MySQL事务的概念
MySQL 事务主要用于处理操作量大,复杂度高的数据。比如说,在人员管理系统中, 要删除一个人员,即需要删除人员的基本资料,又需要删除和该人员相关的信息,如信箱, 文章等等。这样,这些数据库操作语句就构成一个事务。
(1)事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
(2)事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
(3)事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
(4)事务是通过事务的整体性以保证数据的一致性。
说白了,所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。
2、事务的ACID特点
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。
(1)原子性
指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
①事务是一个完整的操作,事务的各元素是不可分的。
②事务中的所有元素必须作为一个整体提交或回滚。
③如果事务中的任何元素失败,则整个事务将失败。
(2)一致性
指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
①当事务完成时,数据必须处于一致状态。
②在事务开始前,数据库中存储的数据处于一致状态。
③在正在进行的事务中,数据可能处于不一致的状态。
④当事务成功完成时,数据必须再次回到已知的一致状态。
(3)隔离性
指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
①对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
②修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
③一个事务的执行不能被其他事务干扰。
(4)持久性
在事务完成以后,该事务所对数据库所作的更改便持久的保存在数据库之中,并不会被回滚。
①指不管系统是否发生故障,事务处理的结果都是永久的。
②一旦事务被提交,事务的效果会被永久地保留在数据库中。
3、事务之间的相互影响
(1)脏读(读取未提交数据):脏读指的是读到了其他事务未提交的数据,未提交意味着这些数据可能会回滚,也就是可能最终不会存到数据库中,也就是不存在的数据。读到了并一定最终存在的数据,这就是脏读
(2)不可重复读(前后多次读取,数据内容不一致):一个事务内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。
(3)幻读(前后多次读取,数据总量不一致):一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有没有修改的数据行,就好象发生了幻觉一样。
(4)丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
4、Mysql及事务隔离级别
(1)read uncommitted(未提交读) : 读取尚未提交的数据 :不解决脏读
允许脏读,其他事务只要修改了数据,即使未提交,本事务也能看到修改后的数据值。也就是可能读取到其他会话中未提交事务修改的数居。
(2)read committed(提交读):读取已经提交的数据 :可以解决脏读
只能读取到已经提交的数据。Oracle等多数数据库默认都是该级别〈不重复读)。
(3)repeatable read(可重复度):重读读取:可以解决脏读 和 不可重复读 —mysql默认的
可重复读。无论其他事务是否修改并提交了数据,在这个事务中看到的数据值始终不受其他事务影响
(4)serializable(串行化):可以解决 脏读 不可重复读 和 虚读—相当于锁表
完全串行化的读,每次读都需要获得表级共享锁,读写相互都会阻塞。
注:mysql默认的事务处理级别是repeatable read ,而Oracle和SQL Server是read committed。
5、事务隔离级别的作用范围
(1)全局级:对所有的会话有效
(2)会话级:只对当前的会话有效
①查询全局事务隔离级别
②查询会话事务隔离级别
③设置全局事务隔离级别
④设置会话事务隔离级别
6、事务控制语句
(1)BEGIN 或 START TRANSACTION:显式地开启一个事务。
(2)COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
(3)ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
(4)SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
(5)ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
①测试提交事务
②测试回滚事务
③测试多点回滚
④使用set设置控制事务
如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。当然无论开启与否,begin; commit|rollback; 都是独立的事务。
四、MySQL存储引擎
1、存储引擎概念介绍
MySQL中的数据用各种不同的技术存储在文件中,每一种技术都使用不同的存储机制、索引技巧、锁定水平并最终提供不同的功能和能力,这些不同的技术以及配套的功能在MySQL中称为存储引擎存储引擎是MySQL将数据存储在文件系统中的存储方式或者存储格式。
(1)MySQL常用的存储引擎:MyISAM(不支持事务、读)、InnoDB(支持事务、读写)
(2)MySQL数据库中的组件,负责执行实际的数据I/O操作,MySQL系统中,存储引擎处于文件系统之上,在数据保存到数据文件之前会传输到存储引擎,之后按照各个存储引擎的存储格式进行存储。
(3)MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的,访问速度快,对事务完整性没有要求,适合查询、插入为主的应用场景。
(4)MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为:.frm 文件存储表结构的定义;数据文件的扩展名为 .MYD (MYData);索引文件的扩展名是 .MYI (MYIndex)。
(5)表级锁定形式,数据在更新时锁定整个表,数据库在读写过程中相互阻塞:串行操作,按照顺序操作,每次在读或写的时候会把全表锁起来,会在数据写入的过程阻塞用户数据的读取,也会在数据读取的过程中阻塞用户的数据写入,特性:数据单独写入或读取,速度过程较快且占用资源相对少。
(6)MyIsam 是表级锁定,读或写无法同时进行,好处是:分开执行时,速度快、资源占用相对较少(相对)。
2、MyISAM 表支持 3 种不同的存储格式
(1)静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。固定长度10,存储非常迅速,容器缓存,故障之后容易恢复。
(2)动态表
动态表包含可变字段(varchar),记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
(3)压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
3、MyISAM适用的生产场景
(1)公司业务不需要事务的支持
(2)单方面读取或写入数据比较多的业务
(3)MyISAM存储引擎数据读写都比较频繁场景不适合
(4)使用读写并发访问相对较低的业务
(5)数据修改相对较少的业务
(6)对数据业务一致性要求不是非常高的业务
(7)服务器硬件资源相对比较差
(8)MyIsam:适合于单方向的任务场景、同时并发量不高、对于事务要求不高的场景
4、InnoDB适用生产场景分析
(1)业务需要事务的支持
(2)行级锁定对高并发有很好的适应能力,但需要确保查询是通过索引来完成
(3)业务数据更新较为频繁的场景(论坛、博客)
(4)业务数据一致性要求较高(银行业务)
(5)硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力。
5、选择存储引擎依据
(1)需要考虑每个存储引擎提供的核心功能及应用场景
(2)支持的字段和数据类型
①所有引擎都支持通用的数据类型
②但是不是所有的引擎都支持其它的字段类型,如二进制对象
(3)锁定类型:不同的存储引擎支持不同级别的锁定
①表锁定
②行锁定
(4)索引的支持
①建立索引在搜索和恢复数据库中的数据时能显著提高性能
②不用的存储引擎提供不同的制作索引的技术
③有些存储引擎根本不支持索引
(5)事务处理的支持
①提高在向表中更新和插入信息期间的可靠性
②可根据企业业务是否要支持事务选择存储引擎
6、修改存储引擎
(1)alter table 修改
alter table table_name engine=引擎;
(2)修改my.cnf,指定默认存储引擎并重启服务
default-storage-engine=InnoDB
(3)create table创建表时指定存储引擎
create table 表名 (字段) engine = 引擎;
(4)Mysql_convert_table_format转化存储引擎
Mysql_convert_table_format-user=root-password=密码
-sock=/tmp/mysql.sock -engine =引擎 库名 表名结
总结
1、普通索引:直接创建索引CREATE INDEX 索引名 ON 表名 (列名[(length)]);、修改表方式创建ALTER TABLE 表名 ADD INDEX 索引名 (列名);、创建表的时候指定索引CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
2、唯一索引:直接创建唯一索引CREATE UNIQUE INDEX 索引名 ON 表名(列名);、修改表方式创建ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);、创建表的时候指定CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
3、主键索引:创建表的时候指定CREATE TABLE 表名 ([...],PRIMARY KEY (列名));、修改表方式创建ALTER TABLE 表名 ADD PRIMARY KEY (列名);
4、组合索引:CREATE TABLE 表名 (列名1 数据类型,列名2 数据类型,列名3 数据类型,INDEX 索引名 (列名1,列名2,列名3));
5、全文索引:直接创建索引CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);、修改表方式创建ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);、创建表的时候指定索引CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));、使用全文索引查询SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
6、查看索引:show index from 表名;
7、删除索引:直接删除索引DROP INDEX 索引名 ON 表名;、修改表方式删除索引ALTER TABLE 表名 DROP INDEX 索引名;、删除主键索引ALTER TABLE 表名 DROP PRIMARY KEY;
8、事务的ACID特点:原子性、一致性、隔离性、持久性
9、事务之间的相互影响:脏读(读取未提交数据)、不可重复读(前后多次读取,数据内容不一致)、幻读(前后多次读取,数据总量不一致)、丢失更新
10、Mysql及事务隔离级别:read uncommitted(未提交读)、read committed(提交读)、repeatable read(可重复度)、serializable(串行化),mysql默认的事务处理级别是repeatable read ,而Oracle和SQL Server是read committed
11、事务隔离级别的作用范围:全局级(对所有的会话有效)、会话级(只对当前的会话有效),查询全局事务隔离级别、查询会话事务隔离级别、设置全局事务隔离级别、设置会话事务隔离级别
12、事务控制语句:BEGIN 或 START TRANSACTION:显式地开启一个事务;COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的;ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改;SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称;ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。测试提交事务、测试回滚事务、测试多点回滚、使用set设置控制事务
13、MySQL常用的存储引擎:MyISAM、InnoDB
14、MyISAM 表支持 3 种不同的存储格式:静态(固定长度)表、动态表、压缩表
15、MyISAM适合在无事务要求,读写并发少的场景使用。
16、InnoDB适合在事务要求,读写并发的场景使用。
17、MySQL存储引擎是MySQL数据库服务器中的一个组件,负责数据库执行实际的数据I/O操作。
18、修改存储引擎多种方式,应根据当前数据库的状态使用不同的方式。