1. 存储引擎
1.1 MySQL体系结构
- 连接层: 最上层是一些客户端和链接服务,主要完成一些类似于连接处理、授权认证、及相关的安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
- 服务层: 第二层架构主要完成大多数的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化,部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。
- 引擎层: 存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样我们可以根据自己的需要,来选取合适的存储引擎。
- 存储层: 主要是将数据存储在文件系统之上,并完成与存储引擎的交互。
1.2 存储引擎简介
存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。
在创建表时指定存储引擎:create table table_name (column_name, column_type) engine = InnoDB;
查看当前数据库支持的存储引擎:show engines;
1.3 存储引擎特点
特点 | InnoDB | MyISAM | Memory |
---|---|---|---|
存储限制 | 64TB | 有 | 有 |
事务安全 | 支持 | - | - |
锁机制 | 行锁 | 表锁 | 表锁 |
B+tree索引 | 支持 | 支持 | 支持 |
Hash索引 | - | - | 支持 |
全文索引 | 支持(5.6版本之后) | 支持 | - |
空间使用 | 高 | 低 | N/A |
内存使用 | 高 | 低 | 中等 |
批量插入速度 | 低 | 高 | 高 |
支持外键 | 支持 | - | - |
1.3.1 InnoDB
介绍:
InnoDB是一种兼顾可靠性和高性能的通用存储引擎,在MySQL5.5之后,InnoDB是默认的MySQL存储引擎。
特点:
- DML操作遵循ACID模型,支持 事务 ;
- 行级锁,提高并发访问性能;
- 支持 外键 FOREIGN KEY约束,保证数据的完整性和正确性;
文件:
xxx.ibd:xxx代表的是表名,InnoDB引擎的每张表都会对应这样一个表空间文件,存储该表的表结构(frm、sdi)、数据和索引。
参数:innodb_file_per_table
逻辑存储结构:
1.3.2 MyISAM
介绍
MyISAM是MySQL早期的默认存储引擎。
特点
- 不支持事务,不支持外键
- 支持表锁,不支持行锁
- 访问速度快
文件
xxx.sdi:存储表结构信息
xxx.MYD:存储数据
xxx.MYI:存储索引
1.3.3 Memory
介绍
Memory引擎的表数据时存储在内存中,由于受到硬件问题、或断电问题的影响,只能将这些表作为临时表或缓存使用。
特点
- 内存存放
- hash索引(默认)
文件
xxx.sdi:存储表结构信息
1.4 存储引擎选择
在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。
- InnoDB: 是MySQL的默认存储引擎,支持事务、外键。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。
- MyISAM: 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
- Memory: 将所有的数据保存在内存中,访问速度快,通常用于临时表及缓存。Memory的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,而且无法保障数据的安全性。
2. 索引
2.1 索引概述
2.1.1 介绍
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
2.1.2 演示
备注:上述二叉树索引结构只是一个示意图,并不是真实的索引结构。
2.1.3 优缺点
优势 | 劣势 |
---|---|
提高数据检索的效率,降低数据库的IO成本。 | 索引列也是要占用空间的。 |
通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。 | 索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE时,效率降低。 |
2.2 索引结构
2.2.1 介绍
MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的结构,主要包含以下几种:
索引结构 | 描述 |
---|---|
B+Tree索引 | 最常见的索引类型,大部分引擎都支持B+树索引 |
Hash索引 | 底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效,不支持范围查询 |
R-tree(空间索引) | 空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少 |
Full-text(全文索引) | 是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES |
索引 | InnoDB | MyISAM | Memory |
---|---|---|---|
B+tree索引 | 支持 | 支持 | 支持 |
Hash索引 | 不支持 | 不支持 | 支持 |
R-tree索引 | 不支持 | 支持 | 不支持 |
Full-text | 5.6版本之后支持 | 支持 | 不支持 |
备注: 我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。
2.2.2 B-Tree
1、二叉树
-
二叉树缺点: 顺序插入时,会形成一个链表,查询性能大大降低。大数据量情况下,层级较深,检索速度慢。
-
红黑树: 大数据量情况下,层级较深,检索速度慢。
2、B-Tree(多路平衡查找树)
以一颗最大度数(max-degree)为5(5阶)的b-tree为例(每个节点最多存储4个key,5个指针):
知识小贴士: 树的度数指的是一个节点的子节点个数。
2.2.3 B+Tree
以一颗最大度数(max-degree)为4(4阶)的b+tree为例:
相对于B-Tree区别:
- 所有的数据都会出现在叶子节点。
- 叶子节点形成一个单向链表。
MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。
2.2.4 Hash
哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。
如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可以通过链表来解决。
Hash索引特点:
- Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,<,…)。
- 无法利用索引完成排序操作。
- 查询效率高,通常只需要一次检索就可以了,效率通常要高于B+Tree索引。
存储引擎支持: 在MySQL中,支持hash索引的是Memory引擎,而InnoDB中具有自适应hash功能,hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。
2.2.5 思考题
为什么InnoDB存储引擎选择使用B+Tree索引结构?
- 相对于二叉树,层级更少,搜索效率更高。
- 对于B-Tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低。
- 相对Hash索引,B+Tree支持范围匹配及排序操作。
2.3 索引分类
分类 | 含义 | 特点 | 关键字 |
---|---|---|---|
主键索引 | 针对于表中主键创建的索引 | 默认自动创建,只能有一个 | PRIMARY |
唯一索引 | 避免同一个表中某数据列中的值重复 | 可以有多个 | UNIQUE |
常规索引 | 快速定位特定数据 | 可以有多个 | |
全文索引 | 全文索引查找的是文本中的关键词,而不是比较索引中的值 | 可以有多个 | FULLTEXT |
在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种:
分类 | 含义 | 特点 |
---|---|---|
聚集索引(Clustered Index) | 将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据 | 必须有,而且只有一个 |
二级索引(Secondary Index) | 将数据与索引分开存储,索引结构的叶子节点关联的是对应的主键 | 可以存在多个 |
聚集索引选取规则:
- 如果存在主键,主键索引就是聚集索引。
- 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
- 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引。
回表查询: 例如语句 select * from user where name = 'Arm;
先从二级索引中找到 ‘Arm’ 对应的主键值 id,再通过主键值 id 到聚集索引中找到这一行的数据。
2.4 索引语法
创建索引:create [unique|fulltext] index index_name on table_name (index_col_name,...);
查看索引:show index from table_name;
删除索引:drop index index_name on table_name;
案例练习:
-- 1. name字段为姓名字段,该字段的值可能会重复,为该字段创建索引。
create index idx_user_name on tb_user (name);
-- 2. phone手机号字段的值,是非空,且唯一的,为该字段创建唯一索引。
create unique index idx_user_phone on tb_user (phone);
-- 3. 为profession、age、status创建联合索引。
create index idx_user_pro_age_sta on tb_user (profession, age, status);
-- 4. 为email建立合适的索引来提升查询效率。
create index idx_user_email on tb_user (email);
2.5 SQL性能分析
2.5.1 SQL执行频率
MySQL客户端连接成功后,通过 show [session|global] status
命令可以提供服务器状态信息。通过如下指令,可以查看当前数据库的 INSERT、UPDATE、DELETE、SELECT的访问频次:show global status like 'Com_______';
mysql> show global status like 'Com_______';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Com_binlog | 0 |
| Com_commit | 0 |
| Com_delete | 0 |
| Com_import | 0 |
| Com_insert | 0 |
| Com_repair | 0 |
| Com_revoke | 0 |
| Com_select | 4 |
| Com_signal | 0 |
| Com_update | 0 |
| Com_xa_end | 0 |
+---------------+-------+
2.5.2 慢查询日志
慢查询日志记录了所有执行时间超过超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。
查看慢查询日志是否开启:show variables like 'slow_query_log';
开启慢查询日志:set global slow_query_log = 1;
关闭慢查询日志:set global slow_query_log = 0;
2.5.3 profiles详情
查看当前MySQL是否支持profile操作:select @@have_profiling;
默认profiling是关闭的,可以通过set语句在session/global级别开启profiling:set profiling = 1;
执行一系列的业务SQL的操作,然后通过如下指令查看指令的执行耗时:
- 查看每一条SQL的耗时基本情况:
show profiles;
- 查看指定query_id的SQL语句各个阶段的耗时情况:
show profile for query query_id;
- 查看指定query_id的SQL语句CPU的使用情况:
show profile cpu for query query_id;
2.5.4 explain执行计划
explain或者desc命令获取MySQL如何执行select语句的信息,包括在select语句执行过程中表如何连接和连接的顺序。
语法:explain select column_name from table_name [where condition];
mysql> explain select * from emp;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
| 1 | SIMPLE | emp | NULL | ALL | NULL | NULL | NULL | NULL | 1 | 100.00 | NULL |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+
explain执行计划各字段含义:
- id:select查询的序列号,表示查询中执行select子句或者是操作表的顺序(id相同,执行顺序从上到下;id不同,值越大,越先执行)。
- select_type:表示select的类型,常见的取值有simple(简单表,即不使用表连接或者子查询)、primary(主查询,即外层的查询)、union(union中的第二个或者后面的查询语句)、subquery(select/where之后包含了子查询)等。
- type:表示连接类型,性能由好到差的连接类型为NULL、system、const、eq_ref、ref、range、index、all。
- possible_key:显示可能应用在这张表上的索引,一个或多个。
- key:实际使用的索引,如果为NULL,则没有使用索引。
- key_len:表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好。
- rows:MySQL认为必须要执行查询的行数,在innodb引擎的表中,是一个估计值,可能并不总是准确的。
- filtered:表示返回结果的行数占需读取行数的百分比,filtered的值越大越好。
2.6 索引使用
2.6.1 验证索引效率
# 在未建立索引之前,执行如下SQL语句,查看SQL的耗时。
select * from tb_sku where sn = '100000003145001';(耗时21.00sec)
# 针对字段创建索引
create index idx_sku_sn on tb_sku (sn);
# 然后再次执行相同的SQL语句,再次查看SQL的耗时。
select * from tb_sku where sn = '100000003145001';(耗时0.01sec)
2.6.2 最左前缀法则
如果索引了多列(联合索引),要遵循最左前缀法则。最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。
如果跳跃某一列,索引将部分失效(后面的字段索引失效)。
联合索引中,出现范围查询(>,<),范围查询右侧的列索引失效。
2.6.3 索引失效情况
- 索引列运算:不要在索引列上进行运算操作,否则索引将失效,例如:
explain select * from tb_user where substring(phone, 10, 2) = '15';
- 字符串不加引号:字符串类型字段使用时,不加括号,索引将失效。
- 模糊查询:如果仅仅是尾部模糊匹配,索引不会失效;如果是头部模糊匹配,索引失效。
- or连接的条件:用or分割开的条件,如果or前面的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
- 数据分布影响:如果MySQL评估使用索引比全表更慢,则不使用索引。
2.6.4 SQL提示
SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
-
use index:
explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';
-
ignore index:
explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';
-
force index:
explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';
2.6.5 覆盖索引&回表查询
尽量使用覆盖索引(查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到),减少select *
。
知识小贴士:
- using index condition:查找使用了索引,但是需要回表查询数据。
- using where; using index:查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据。
思考: 一张表,有四个字段(id,username,password,status),由于数据量大,需要对以下SQL语句进行优化,该如何进行优化才是最优方案:select id, username, password from tb_user where username = 'itcast';
答: 对字段 username、password 建立联合索引即可,id 字段就是叶子节点。
2.6.6 前缀索引
当字段类型为字符串(varchar,text等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO,影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。
语法:create index index_name on table_name (column(n));
前缀长度:可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高,唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。
select count(distinct email)/count(*) from tb_user;
select count(distinct substring(email,1,5))/count(*) from tb_user;
2.6.7 单列索引&联合索引
单列索引:即一个索引只包含单个列。
联合索引:即一个索引包含了多个列。
在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引,而非单列索引。
联合索引情况:
2.7 索引设计原则
- 针对于数据量较大,且查询比较频繁的表建立索引。
- 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引。
- 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。
- 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。
- 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间,避免回表,提高查询效率。
- 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。
- 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询。
3. SQL优化
3.1 插入数据
-
insert优化
-
批量插入
insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry');
-
手动提交事务
start transaction; insert into tb_test values(1,'Tom'),(2,'Cat'),(3,'Jerry'); insert into tb_test values(4,'Tom'),(5,'Cat'),(6,'Jerry'); insert into tb_test values(7,'Tom'),(8,'Cat'),(9,'Jerry'); commit;
-
主键顺序插入
主键乱序插入:8 1 9 21 88 2 4 15 89 5 7 3 主键顺序插入:1 2 3 4 5 7 8 9 15 21 88 89
-
-
大批量插入数据
如果一次性需要插入大批量数据,使用insert语句插入性能较低,此时可以使用MySQL数据库提供的load指令进行插入。操作如下:
# 客户端连接服务端时,加上参数 --local-infile mysql --local-infile -u root -p # 设置全局参数local_infile为1,开启从本地加载文件导入数据的开关 set global local_infile = 1; # 执行load指令将准备好的数据,加载到表结构中 load data local infile '/root/sql1.log' into table tb_user fields terminated by ',' lines terminated by '\n';
3.2 主键优化
-
数据组织方式
在InnoDB存储引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表IOT(index organized table)。
-
页分裂
页可以为空,也可以填充一半,也可以填充100%。每个页包含了2-N行数据(如果一行数据过大,会行溢出),根据主键排列。
- 主键顺序插入
- 主键乱序插入
- 主键顺序插入
-
页合并
当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记(flaged)为删除并且它的空间变得允许被其他记录声明使用。
当页中删除的记录达到 MERGE-THRESHOLD(默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用。
知识小贴士:MERGE-THRESHOLD:合并页的阈值,可以自己设置,在创建表或者创建索引时指定。 -
主键设计原则
- 满足业务需求的情况下,尽量降低主键的长度。
- 插入数据时,尽量选择顺序插入,选择使用AUTO_INCREMENT自增主键。
- 尽量不要使用UUID做主键或者是其他自然主键,如身份证号。
- 业务操作时,避免对主键的修改。
3.3 order by优化
- Using filesort:通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区 sort buffer 中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。
- Using index:通过有序索引顺序扫描直接返回有序数据,这种情况即为 using index,不需要额外排序,操作效率高。
# 根据 age,phone 进行降序一个升序,一个降序
explain select id, age, phone from tb_user order by age asc, phone desc;
# 创建索引
create index idx_user_age_phone_ad on tb_user(age asc, phone desc);
- 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。
- 尽量使用覆盖索引。
- 多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASC/DESC)。
- 如果不可避免地出现 filesort,大数据量排序时,可以适当增大排序缓冲区大小sort_buffer_size(默认256k)。
3.4 group by优化
- 在分组操作时,可以通过索引来提高效率。
- 分组操作时,索引的使用也是满足最左前缀法则的。
3.5 limit优化
一个常见又非常头疼的问题就是 limit 2000000,10,此时需要MySQL排序前 2000010 条记录,仅仅返回 2000000 - 2000010 的记录,其他记录丢弃,查询排序的代价非常大。
优化思路:一般分页查询时,通过创建覆盖索引能够比较好地提高性能,可以通过覆盖索引加子查询形式进行优化。
explain select s.* from tb_sku s, (select id from tb_sku order by id limit 2000000,10) t where s.id = t.id;
3.6 count优化
- MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) 的时候会直接返回这个数,效率很高。
- InnoDB 引擎就麻烦了,它执行 count(*) 的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。
优化思路:自己计数。
-
count的几种用法
-
count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加,最后返回累计值。
-
用法:count(*)、count(主键)、count(字段)、count(1)。
-
count(主键)
InnoDB 引擎会遍历整张表,把每一行的主键 id 值都取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为null)。
-
count(字段)
没有 not null 约束:InnoDB 引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,服务层判断是否为null,不为null,计数累加。
有 not null 约束:InnoDB 引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,直接按行进行累加。 -
count(1)
InnoDB 引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字 “1” 进去,直接按行进行累加。
-
count(*)
InnoDB 引擎并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加。
-
-
按照效率排序的话,count(字段) < < < count(主键) < < < count(1) ≈ \approx ≈ count(*),所以尽量使用 count(*)。
3.7 update优化
update student set no = '2000100100' where id = 1;
update student set no = '2000100105' where name = '韦一笑';
InnoDB的行锁是针对索引加的锁,不是针对记录加的锁,并且该索引不能失效,否则会从行锁升级为表锁。
4. 视图/存储过程/触发器
4.1 视图
4.1.1 介绍及基本语法
-
介绍
视图(View)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。
通俗的讲,视图只保存了查询的SQL逻辑,不保存查询结果。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。
-
创建视图
create [or replace] view view_name as select语句 [with [cascaded | local] check option];
-
查询视图
查看创建视图语句:show create view view_name; 查看视图数据:select * from view_name;
-
修改视图
方式一:create [or replace] view view_name as select语句 [with [cascaded | local] check option]; 方式二:alter view view_name as select语句 [with [cascaded | local] check option];
-
删除视图
drop view [if exists] view_name;
4.1.2 检查选项
当使用 with check option 子句创建视图时,MySQL会通过视图检查正在更改的每个行,例如插入,更新,删除,以使其符合视图的定义。MySQL允许基于另一个视图创建视图,它还会检查依赖视图中的规则以保持一致性。为了确定检查的范围,MySQL提供了两个选项:CASCADED 和 LOCAL,默认值为 CASCADED。
CASCADED:
LOCAL:
4.1.3 更新及作用
-
更新
要使视图可更新,视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含以下任何一项,则该视图不可更新:- 聚合函数或窗口函数(sum()、min()、max()、count()等)
- distinct
- group by
- having
- union 或者 union all
-
作用
- 简单:视图不仅可以简化用户对数据的理解,也可以简化他们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件。
- 安全:数据库可以授权,但不能授权到数据库特定行和特定的列上。通过视图用户只能查询和修改他们所能见到的数据。
- 数据独立:视图可以帮助用户屏蔽真实表结构变化带来的影响。
4.1.4 案例
-- 1. 为了保证数据库表的安全性,开发人员在操作tb_user表时,只能看到的用户的基本字段,屏蔽手机号和邮箱两个字段。
create view tb_user_view as select id, name, profession, age, gender, status, createtime from tb_user;
-- 2. 查询每个学生所选修的课程(三张表联查),这个功能在很多业务中都有使用到,为了简化操作,定义一个视图。
create view tb_stu_course_view as select s.name student_name, s.no student_no, c.name course_name from student s, student_course sc, course c where s.id = sc.studentid and sc.courseid = c.id;
4.2 存储过程
4.2.1 介绍
-
介绍
存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。
存储过程思想上很简单,就是数据库SQL语言层面的代码封装与重用。
-
特点
- 封装,复用
- 可以接收参数,也可以返回数据
- 减少网络交互,效率提升
4.2.2 基本语法
- 创建
create procedure procedure_name([参数列表]) begin --SQL语句 end;
- 调用
call procedure_name([参数列表]);
- 查看
# 查询指定数据库的存储过程及状态信息 select * from information_schema.ROUTINES where ROUTINE_SCHEMA = database_name; # 查询某个存储过程的定义 show create procedure procedure_name;
- 删除
drop procedure [if exists] procedure_name;
注意: 在命令行中,执行创建存储过程的SQL时,需要通过关键字 delimiter
指定SQL语句的结束符。
4.2.3 变量-系统变量
系统变量是MySQL服务器提供,不是用户定义的,属于服务器层面。分为全局变量(GLOBAL)、会话变量(SESSION)。
-
查看系统变量
# 查看所有系统变量 show [session|global] variables; # 可以通过LIKE模糊匹配方式查找变量 show [session|global] variables like '......'; # 查看指定变量的值 select @@[session|global] 系统变量名;
-
设置系统变量
set [session|global] 系统变量名 = 值; set @@[session|global]系统变量名 = 值;
注意:
- 如果没有指定session/global,默认是session,会话变量。
- MySQL服务器重新启动后,所设置的全局参数会失效,要想不失效,可以在 /etc/my.cnf 中配置。
4.2.4 变量-用户定义变量
用户定义变量是用户根据需要自己定义的变量,用户变量不用提前声明,在用的时候直接用“@变量名”使用就可以。其作用域为当前连接。
-
赋值
set @var_name = expr[, @var_name = expr]...; set @var_name := expr[, @var_name := expr]...;
select @var_name := expr[, @var_name := expr]...; select column_name into @var_name from table_name;
-
使用
select @var_name;
注意:用户定义的变量无需对其进行声明或初始化,只不过获取到的值为NULL。
4.2.5 变量-局部变量
局部变量是根据需要定义的在局部生效的变量,访问之前,需要 declare
声明。可用作存储过程内的局部变量和输入参数,局部变量的范围是在其内声明的 begin...end
块。
-
声明
declare 变量名 变量类型 [default ...];
变量类型就是数据库字段类型:INT、BIGINT、CHAR、VARCHAR、DATE、TIME等。
-
赋值
set 变量名 = 值; set 变量名 := 值; select column_name into @var_name from table_name;
4.2.6 IF判断
语法:
if 条件1 then
...
elseif 条件2 then --可选
...
else --可选
...
end if;
create procedure p1()
begin
declare score int default 58;
declare result varchar(10);
if score >= 85 then
set result := '优秀';
elseif score >=60 then
set result := '及格';
else
set result := '不及格';
end if;
select result;
end;
4.2.7 参数(IN,OUT,INOUT)
-
参数
类型 含义 备注 IN 该类参数作为输入,也就是需要调用时传入值 默认 OUT 该类参数作为输出,也就是该参数可以作为返回值 INOUT 既可以作为输入参数,也可以作为输出参数 -
用法
create procedure 存储过程名称([IN/OUT/INOUT 参数名 参数类型]) begin -- SQL语句 end;
create procedure p1(in score int, out result varchar(10))
begin
if score >= 85 then
set result := '优秀';
elseif score >=60 then
set result := '及格';
else
set result := '不及格';
end if;
end;
call p1(score: @score, result: @result);
select @result;
create procedure p1(inout score double)
begin
set score := score * 0.5;
end;
set @score := 180;
call p1(score: @score);
select @score;
4.2.8 case
-
语法一
case case_value when when_value1 then statement_list1 [when when_value2 then statement_list2]... [else statement_list] end case;
-
语法二
case when search_condition1 then statement_list1 [when search_condition2 then statement_list2]... [else statement_list] end case;
create procedure p1(in month int)
begin
declare result varchar(10);
case
when month >= 1 and month <= 3 then
set result := '第一季度';
when month >= 4 and month <= 6 then
set result := '第二季度';
when month >= 7 and month <= 9 then
set result := '第三季度';
when month >= 10 and month <= 12 then
set result := '第四季度';
else
set result := '非法参数' ;
end case;
select concat('您输入的月份为:', month, ',所属的季度为:', result);
end;
4.2.9 循环-while
while循环是有条件的循环控制语句。满足条件后,再执行循环体中的SQL语句。
具体语法为:
# 先判定条件,如果条件为true,则执行逻辑,否则,不执行逻辑
while 条件 do
SQL逻辑...
end while;
create procedure p1(in n int)
begin
declare total int default 0;
while n > 0 do
set total := total + n;
set n := n - 1;
end while;
select total;
end;
4.2.10 循环-repeat
repeat是有条件的循环控制语句,当满足条件的时候退出循环。
具体语法为:
# 先执行一次逻辑,然后判定逻辑是否满足,如果满足,则退出。如果不满足,则继续下一次循环
repeat
SQL逻辑...
until 条件
end repeat;
create procedure p1(in n int)
begin
declare total int default 0;
repeat
set total := total + n;
set n := n - 1;
until n <= 0
end repeat;
select total;
end;
4.2.11 循环-loop
loop实现简单的循环,如果不在SQL逻辑中增加退出循环的条件,可以用其来实现简单的死循环。loop可以配合一下两个语句使用:
- leave:配合循环使用,退出循环。
- iterate:必须用在循环中,作用是跳过当前循环剩下的语句,直接进入下一次循环。
[begin_label:] loop
SQL逻辑...
end loop [end_label];
leave label; -- 退出指定标记的循环体
iterate label; -- 直接进入下一次循环
1、计算从1累加到n的值,n为传入的参数值。
create procedure p1(in n int)
begin
declare total int default 0;
sum:loop
if n <= 0 then
leave sum;
end if;
set total := total + n;
set n := n - 1;
end loop sum;
select total;
end;
2、计算1到n之间的偶数累加的值,n为传入的参数值。
create procedure p1(in n int)
begin
declare total int default 0;
sum:loop
if n <= 0 then
leave sum;
end if;
if n % 2 = 1 then
set n := n - 1;
iterate sum;
end if;
set total := total + n;
set n := n - 1;
end loop sum;
select total;
end;
4.2.12 游标-cursor
游标(cursor)是用来存储查询结果集的数据类型,在存储过程和函数中可以使用游标对结果集进行循环的处理。游标的使用包括游标的声明、open、fetch和close,其语法分别如下:
声明游标:declare 游标名称 cursor for 查询语句;
打开游标:open 游标名称;
获取游标记录:fetch 游标名称 into 变量;
关闭游标:close 游标名称;
4.2.13 条件处理程序-handler
条件处理程序(Handler)可以用来定义在流程控制结构执行过程中遇到问题时相应的处理步骤。
具体语法为:
declare handler_action handler for condition_value [, condition_value]... statement;
handler_action
continue:继续执行当前程序
exit:终止执行当前程序
condition_value
SQLSTATE sqlstate_value:状态码,如 02000
SQLWARNING:所有以01开头的SQLSTATE代码的简写
NOT FOUND:所有以02开头的SQLSTATE代码的简写
SQLEXCEPTION:所有没有被 SQLWARNING 或 NOT FOUND 捕获的SQLSTATE代码的简写
create procedure p1(in uage int)
begin
declare uname varchar(100);
declare upro varchar(100);
declare u_cursor cursor for select name, profession from tb_user where age <= uage;
declare exit handler for not found close u_cursor;
drop table if exists tb_user_pro;
create table if not exists tb_user_pro(
id int primary key auto_increment,
name varchar(100),
profession varchar(100)
);
open u_cursor;
while true do
fetch u_cursor into uname, upro;
insert into tb_user_pro values (null, uname, upro);
end while;
end;
4.3 存储函数
存储函数是有返回值的存储过程,存储函数的参数只能是IN类型的。
具体语法如下:
create function 存储函数名称([参数列表])
returns type [characteristic...]
begin
--SQL语句
return ...;
end;
characteristic说明:
- DETERMINISTIC:相同的输入参数总是产生相同的结果。
- NO SQL:不包含 SQL 语句。
- READS SQL DATA:包含读取数据的语句,但不包含写入数据的语句。
create function func1(n int)
returns int deterministic
begin
declare total in default 0;
while n > 0 do
set total := total + n;
set n := n - 1;
end while;
return total;
end;
4.4 触发器
4.4.1 介绍
触发器是与表有关的数据库对象,指在 insert/update/delete 之前或之后,触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性,日志记录,数据校验等操作。
使用别名 OLD 和 NEW 来引用触发器中发生变化的记录内容,这与其他的数据库是相似的。现在触发器还只支持行级触发,不支持语句级触发。
触发器类型 | NEW 和 OLD |
---|---|
INSERT 型触发器 | NEW 表示将要或者已经新增的数据 |
UPDATE 型触发器 | OLD 表示修改之前的数据,NEW 表示将要或已经修改后的数据 |
DELETE 型触发器 | OLD 表示将要或者已经删除的数据 |
4.4.2 案例1(insert类型)
- 语法
-
创建
create trigger trigger_name before/after insert/update/delete on table_name for each row begin trigger_statement; end;
-
查看
show triggers;
-
删除
drop trigger [schema_name.]trigger_name; -- 如果没有指定schema_name,默认为当前数据库。
-
插入数据触发器
create trigger tb_user_insert_trigger after insert on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
values (null, 'insert', now(), new.id, concat('插入的数据内容为:id=', new.id, ', name=', new.name, ', phone=', new.phone, ', email=', new.email, ', profession=', new.profession));
end;
4.4.3 案例2(update类型)
修改数据触发器
create trigger tb_user_update_trigger after update on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
values (null, 'update', now(), new.id,
concat('更新之前的数据内容为:id=', old.id, ', name=', old.name, ', phone=', old.phone, ', email=', old.email, ', profession=', old.profession,
' | 更新之后的数据内容为:id=', new.id, ', name=', new.name, ', phone=', new.phone, ', email=', new.email, ', profession=', new.profession));
end;
4.4.4 案例3(delete类型)
删除数据触发器
create trigger tb_user_delete_trigger after delete on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
values (null, 'delete', now(), old.id, concat('删除之前的数据内容为:id=', old.id, ', name=', old.name, ', phone=', old.phone, ', email=', old.email, ', profession=', old.profession));
end;
5. 锁
5.1 概述
-
介绍
锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(CPU、RAM、I/O)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。
-
分类
MySQL中的锁,按照锁的粒度分,分为以下三类:
1、全局锁:锁定数据库中的所有表。
2、表级锁:每次操作锁住整张表。
3、行级锁:每次操作锁住对应的行数据。
5.2 全局锁
5.2.1 介绍
-
介绍
全局锁就是对整个数据库实例加锁,加锁后整个实例就处于只读状态,后续的DML语句,DDL语句,以及更新操作的事务提交语句都将被阻塞。
其典型的使用场景是做全库的逻辑备份,对所有的表进行锁定,从而获取一致性视图,保证数据的完整性。
-
演示
加锁:flush tables with read lock;
数据备份:
mysqldump -uroot -p密码 database_name > database_name.sql
解锁:
unlock tables;
5.2.2 一致性数据备份
-
特点
数据库中加全局锁,是一个比较重的操作,存在以下问题:
1、如果在主库上备份,那么在备份期间都不能执行更新,业务基本上就得停摆。
2、如果在从库上备份,那么在备份期间从库不能执行主库同步过来的二进制日志(binlog),会导致主从延迟。
在InnoDB引擎中,我们可以在备份时加上参数 –single-transaction 参数来完成不加锁的一致性数据备份。
mysqldump --single-transaction -uroot -p密码 database_name > database_name.sql
5.3 表级锁
介绍:表级锁,每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中。
对于表级锁,主要分为以下三类:
1、表锁
2、元数据锁(meta data lock,MDL)
3、意向锁
5.3.1 表锁
对于表锁,分为两类:
- 表共享读锁(read lock)
- 表独占写锁(write lock)
语法:
- 加锁:
lock tables table_name read / write;
- 释放锁:
unlock tables;
读锁 不会阻塞其他客户端的读,但是会阻塞写。
写锁 既会阻塞其他客户端的读,又会阻塞其他客户端的写。
5.3.2 元数据锁
MDL加锁过程是系统自动控制,无需显式使用,在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据的数据一致性,在表上有活动事务的时候,不可以对元数据进行写入操作。为了避免DML与DDL冲突,保证读写的正确性。
在MySQL5.5中引入了MDL,当对一张表进行增删改查的时候,加MDL读锁(共享),当对表结构进行变更操作的时候,加MDL写锁(排他)。
对应SQL | 锁类型 | 说明 |
---|---|---|
lock tables xxx read / write | SHARED_READ_ONLY / SHARED_NO_READ_WRITE | |
select、select … lock in share mode | SHARED_READ | 与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥 |
insert、update、delete、select … for update | SHARED_WRITE | 与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥 |
alter table … | EXCLUSIVE | 与其他的MDL都互斥 |
查看元数据锁:select object_type, object_schema, object_name, lock_type, lock_duration from performance_schema.metadata_locks;
5.3.3 意向锁
为了避免DML在执行时,加的行锁与表锁的冲突,在InnoDB中引入了意向锁,使得表锁不用检查每行数据是否加锁,使用意向锁来减少表锁的检查。
1、意向共享锁(IS):由语句 select ... lock in share mode;
添加,与表锁共享锁(read)兼容,与表锁排他锁(write)互斥。
2、意向排他锁(IX):由 insert、update、delete、select … for update 添加,与表锁共享锁(read)及排他锁(write)都互斥。意向锁之间不会互斥。
可以通过以下SQL,查看意向锁及行锁的加锁情况:select object_schema, object_name, index_name, lock_type, lock_mode, lock_data from performance_schema.data_locks;
5.4 行级锁
5.4.1 介绍
行级锁,每次操作锁住对应的行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用在InnoDB存储引擎中。
InnoDB的数据是基于索引组织的,行锁是通过对索引上的索引项加锁来实现的,而不是对记录加的锁。对于行级锁,主要分为以下三类:
- 行锁(Record Lock):锁定单个行记录的锁,防止其他事务对此进行update和delete。在RC、RR隔离级别下都支持。
- 间隙锁(Gap Lock):锁定索引记录间隙(不含该记录),确保索引记录间隙不变,防止其他事务在这个间隙进行insert,产生幻读。在RR隔离级别下都支持。
- 临键锁(Next-Key Lock):行锁和间隙锁组合,同时锁住数据,并锁住数据前面的间隙Gap。在RR隔离级别下支持。
5.4.2 行锁
InnoDB实现了以下两种类型的行锁:
- 共享锁(S):允许一个事务去读一行,阻止其他事务获得相同数据集的排他锁。
- 排他锁(X):允许获取排他锁的事务更新数据,阻止其他事务获得相同数据集的共享锁和排他锁。
当前锁类型 \ 请求锁类型 | S(共享锁) | X(排他锁) |
---|---|---|
S(共享锁) | 兼容 | 冲突 |
X(排他锁) | 冲突 | 冲突 |
SQL | 行锁类型 | 说明 |
---|---|---|
insert… | 排他锁 | 自动加锁 |
update… | 排他锁 | 自动加锁 |
delete… | 排他锁 | 自动加锁 |
select(正常) | 不加任何锁 | |
select … lock in share mode | 共享锁 | 需要手动在 select 之后加 lock in share mode |
select … for update | 排他锁 | 需要手动在 select 之后加 for update |
默认情况下,InnoDB在REPEATABLE READ事务隔离级别运行,InnoDB使用next-key锁进行搜索和索引扫描,以防止幻读。
- 针对唯一索引进行检索时,对已存在的记录进行等值匹配时,将会自动优化为行锁。
- InnoDB的行锁是针对于索引加的锁,不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,此时就会升级为表锁。
5.4.3 间隙锁&临键锁
默认情况下,InnoDB在 REPEATABLE READ 事务隔离级别运行,InnoDB使用 next-key 锁进行搜索和索引扫描,以防止幻读。
- 索引上的等值查询(唯一索引),给不存在的记录加锁时,优化为间隙锁。
- 索引上的等值查询(普通索引),向右遍历时最后一个值不满足查询要求时,next-key lock 退化为间隙锁。
- 索引上的范围查询(唯一索引),会访问到不满足条件的第一个值为止。
注意:间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存,一个事务采用的间隙锁不会阻止另一个事务在同一间隙上采用间隙锁。
6. InnoDB引擎
6.1 逻辑存储结构
表空间(ibd文件): 一个MySQL实例可以对应多个表空间,用于存储记录、索引等数据。
段: 分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段就是B+树的非叶子节点。段用来管理多个区(Extent)。
区: 表空间的单元结构,每个区的大小为1M。默认情况下,InnoDB存储引擎页大小为16K,即一个区中一共有64个连续的页。
页: 是InnoDB存储引擎磁盘管理的最小单元,每个页的大小默认为16KB。为了保证页的连续性,InnoDB存储引擎每次从磁盘申请4-5个区。
行: InnoDB存储引擎数据是按行进行存放的。
Trx_id: 每次对某条记录进行改动时,都会把对应的事务id赋值给trx_id隐藏列。
Roll_pointer: 每次对某条引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
6.2 架构
MySQL5.5 版本开始,默认使用InnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。下面是InnoDB架构图,左侧为内存结构,右侧为磁盘结构。
6.2.1 内存结构
Buffer Pool: 缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据(若缓冲池没有数据,则从磁盘加载并缓存),然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快处理速度。
缓冲池以Page页为单位,底层采用链表数据结构管理Page。根据状态,将Page分为三种类型:
- free page:空闲page,未被使用。
- clean page:被使用page,数据没有被修改过。
- dirty page:脏页,被使用page,数据被修改过,页中数据与磁盘的数据产生了不一致。
Change Buffer: 更改缓冲区(针对于非唯一二级索引页),在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而会将数据变更存在更改缓冲区Change Buffer中,在未来数据被读取时,再将数据合并恢复到Buffer Pool中,再将合并后的数据刷新到磁盘中。
Change Buffer的意义是什么?
与聚集索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引。同样,删除和更新可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO。有了Change Buffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO。
Adaptive Hash Index: 自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控对表上各索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。
自适应hash索引,无需人工干预,是系统根据情况自动完成。
参数:adaptive_hash_index
Log Buffer: 日志缓冲区,用来保存要写入到磁盘中的log日志数据(redo log、undo log),默认大小为16MB,日志缓冲区的日志会定期刷新到磁盘中。如果需要更新、插入或删除许多行的事务,增加日志缓冲区的大小可以节省磁盘IO。
参数:
innodb_log_buffer_size
:缓冲区大小innodb_flush_log_at_trx_commit
:日志刷新到磁盘时机
6.2.2 磁盘结构
System Tablespace: 系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建的,它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等)
参数:innodb_data_file_path
File-Per-Table Tablespaces: 每个表的文件表空间包含单个InnoDB表的数据和索引,并存储在文件系统上的单个数据文件中。
参数:innodb_file_per_table
General Tablespaces: 通用表空间,需要通过 create tablespace
语法创建通用表空间,在创建表时,可以指定该表空间。
创建表空间:create tablespace tablespace_name add datafile XXX.ibd engine = innodb;
Undo Tablespaces: 撤销表空间,MySQL实例在初始化时会自动创建两个默认的undo表空间(初始大小16M),用于存储undo log日志。
Temporary Tablespaces: InnoDB使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据。
Doublewrite Buffer Files: 双写缓冲区,InnoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中(#ib_16384_0.dblwr,#ib_16384_1.dblwr),便于系统异常时恢复数据。
Redo Log: 重做日志,是用来实现事务的持久性。该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo log),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都会存到该日志中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用。
以循环方式写入重做日志文件,涉及两个文件:ib_logfile0,ib_logfile1
6.2.3 后台线程
1. Master Thread
核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性,还包括脏页的刷新、合并插入缓存、undo页的回收。
2. IO Thread
在InnoDB存储引擎中大量使用了AIO来处理IO请求,这样可以极大地提高数据库的性能,而IO Thread主要负责这些IO请求的回调。
线程类型 | 默认个数 | 职责 |
---|---|---|
Read thread | 4 | 负责读操作 |
Write thread | 4 | 负责写操作 |
Log thread | 1 | 负责将日志缓冲区刷新到磁盘 |
Insert buffer thread | 1 | 负责将写缓冲区内容刷新到磁盘 |
3. Purge Thread
主要用于回收事务已经提交了的undo log,在事务提交之后,undo log可能不用了,就用它来回收。
4. Page Cleaner Thread
协助 Master Thread 刷新脏页到磁盘的线程,它可以减轻 Master Thread 的工作压力,减少阻塞。
6.3 事务原理
6.3.1 概述
-
事务
事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
-
特性
- 原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
- 一致性(Consistency):事务完成时,必须使所有的数据保持一致状态。
- 隔离性(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
- 持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
6.3.2 redolog
重做日志,是用来实现事务的持久性。
该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo log file),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都会存到该日志中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用。
6.3.3 undolog
回滚日志,用于记录数据被修改前的信息,作用包含两个:提供回滚和MVCC(多版本并发控制)。
undo log和redo log记录物理日志不一样,它是逻辑日志。可以认为当delete一条记录时,undo log中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rollback时,就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。
Undo log销毁:undo log在事务执行时产生,事务提交时,并不会立即删除undo log,因为这些日志可能还用于MVCC。
Undo log存储:undo log采用段的方式进行管理和记录,存放在前面介绍的rollback segment回滚段中,内部包含1024个undo log segment。
6.4 MVCC
6.4.1 基本概念
-
当前读
读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁.对于我们日常的操作,如:
select … lock in share mode(共享锁),select … for update、update、insert、delete(排他锁)都是一种当前读。 -
快照读
简单的select(不加锁)就是快照读,快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。
- Read Committed:每次select,都生成一个快照读。
- Repeatable Read:开启事务后第一个select语句才是快照读的地方。
- Serializable:快照读会退化为当前读。
-
MVCC
全称 Multi-Version Concurrency Control,多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现,还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。
6.4.2 隐藏字段
隐藏字段 | 含义 |
---|---|
DB_TRX_ID | 最近修改事务ID,记录插入这条记录或最后一次修改该记录的事务ID。 |
DB_ROLL_PTR | 回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本。 |
DB_ROW_ID | 隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段。 |
6.4.3 undolog版本链
-
undo log
回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志。
当insert的时候,产生的undo log日志只在回滚时需要,在事务提交后,可被立即删除。
而update、delete的时候,产生的undo log日志不仅在回滚时需要,在快照读时也需要,不会立即被删除。
-
undo log版本链
不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表的尾部是最早的旧记录。
6.4.4 readview介绍
ReadView(读视图)是快照读SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id。
ReadView中包含了四个核心字段:
字段 | 含义 |
---|---|
m_ids | 当前活跃的事务ID集合 |
min_trx_id | 最小活跃事务ID |
max_trx_id | 预分配事务ID,当前最大事务ID+1(因为事务ID是自增的) |
creator_trx_id | ReadView创建者的事务ID |
版本链数据访问规则:
- trx_id == creator_trx_id ? 可以访问该版本 ⟹ \Longrightarrow ⟹ 成立,说明数据是当前这个事务更改的。
- trx_id < min_trx_id ? 可以访问该版本 ⟹ \Longrightarrow ⟹ 成立,说明数据已经提交了。
- trx_id > max_trx_id ? 不可以访问该版本 ⟹ \Longrightarrow ⟹ 成立,说明该事务是在ReadView生成后才开启。
- min_trx_id <= trx_id <= max_trx_id ? 如果trx_id不在m_ids中是可以访问该版本的 ⟹ \Longrightarrow ⟹ 成立,说明数据已经提交。
不同的隔离级别,生成ReadView的时机不同:
- READ COMMITTED:在事务中每一次执行快照读时生成ReadView。
- REPEATABLE READ:仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。
6.4.5 原理分析(RC级别)
RC隔离级别下,在事务中每一次执行快照读时生成ReadView。
6.4.6 原理分析(RR级别)
RR隔离级别下,仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。
7. MySQL管理
7.1 系统数据库
MySQL数据库安装完成后,自带了以下四个数据库,具体作用如下:
数据库 | 含义 |
---|---|
mysql | 存储MySQL服务器正常运行所需要的各种信息(时区、主从、用户、权限等) |
information_schema | 提供了访问数据库元数据的各种表和视图,包含数据库、表、字段类型及访问权限等 |
performance_schema | 为MySQL服务器运行时状态提供了一个底层监控功能,主要用于收集数据库服务器性能参数 |
sys | 包含了一系列方便DBA和开发人员利用performance_schema性能数据库进行性能调优和诊断的视图 |
7.2 常用工具
7.2.1 mysql
该mysql不是指mysql服务,而是指mysql的客户端工具。
语法:
mysql [options] [database]
选项:
-u, --user=name #指定用户名
-p, --password[=name] #指定密码
-h, --host=name #指定服务器IP或域名
-P, --port=port #指定连接端口
-e, --execute=name #执行SQL语句并退出
-e选项可以在MySQL客户端执行SQL语句,而不用连接到MySQL数据库再执行,对于一些批处理脚本,这种方式尤其方便。
示例:
mysql -uroot -p123456 db01 -e"select * from stu";
7.2.2 mysqladmin
mysqladmin 是一个执行管理操作的客户端程序。可以用它来检查服务器的配置和当前状态、创建并删除数据库等。
通过帮助文档查看选项:
mysqladmin --help
示例:
mysqladmin -uroot -p123456 drop 'test01';
mysqladmin -uroot -p123456 version;
7.2.3 mysqlbinlog
由于服务器生成的二进制日志文件以二进制格式保存,所以如果想要检查这些文本的文本格式,就会使用到mysqlbinlog日志管理工具。
语法:
mysqlbinlog [options] log-file1 log-file2 ...
选项:
-d, --database=name #指定数据库名称,只列出指定的数据库相关操作。
-o, --offset=# #忽略掉日志中的前n行命令。
-r, --result-file=name #将输出的文本格式日志输出到指定文件。
-s, --short-form #显示简单格式,省略掉一些信息。
--start-datetime=date1 --stop-datetime=date2 #指定日期间隔内的所有日志。
--start-position=pos1 --stop-position=pos2 #指定位置间隔内的所有日志。
7.2.4 mysqlshow
mysqlshow 客户端对象查找工作,用来很快地查找存在哪些数据库、数据库中的表、表中的列或者索引。
语法:
mysqlshow [options] [db_name [table_name [col_name]]]
选项:
--count 显示数据库及表的统计信息(数据库,表均可以不指定)
-i 显示指定数据库或者指定表的状态信息
示例:
#查询每个数据库的表的数量及表中记录的数量
mysqlshow -uroot -p2143 --count
#查询test库中每个表中的字段数及行数
mysqlshow -uroot -p2143 test --count
#查询test库中book表的详细情况
mysqlshow -uroot -p2143 test book --count
7.2.5 mysqldump
mysqldump 客户端工具用来备份数据库或在不同数据库之间进行数据迁移。备,及插入表的SQL语句。
语法:
mysqldump [options] db_name [tables]
mysqldump [options] --database/-B db1 [db2 db3...]
mysqldump [options] --all-databases/-A
连接选项:
-u, --user=name 指定用户名
-p, --password[=name] 指定密码
-h, --host=name 指定服务器ip或域名
-P, --port=# 指定连接端口
输出选项:
--add-drop-database 在每个数据库创建语句前加上drop database语句
--add-drop-table 在每个表创建语句前加上drop table语句,默认开启;不开启(--skip-add-drop-table)
-n, --no-create-db 不包含数据库的创建语句
-t, --no-create-info 不包含数据表的创建语句
-d, --no-data 不包含数据
-T, --tab=name 自动生成两个文件:一个.sql文件,创建表结构的语句;一个.txt文件,数据文件
7.2.6 mysqlimport/source
mysqlimport 是客户端数据导入工具,用来导入mysqldump 加 -T参数后导出的文本文件。
语法:
mysqlimport [options] db_name textfile1 [textfile2 ...]
示例:
mysqlimport -uroot -p2143 test/tmp/city.txt
如果需要导入sql文件,可以使用mysql中的source指令:
语法:
source /root/xxxxx.sql
8. 进阶篇总结
恭喜您,经过存储引擎、索引、SQL优化、视图/存储过程/触发器、锁、InnoDB引擎、MySQL管理的练习后,您已成功超越90%的MySQL玩家啦!!!
接下来请前往 运维篇 开始新的学习吧!