黑马MySQL进阶篇笔记

连接层：最上层是一些客户端和链接服务，主要完成一些类似于连接处理、授权认证、及相关安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
服务层：第二次架构主要完成大多数的核心服务功能，如SQL接口，并完成缓存，SQL的分析和优化，部分内置函数的执行。所有跨存储引擎的功能也在这一层实现，如过程、函数等。
引擎层：存储引擎真正的负责了MySQL中数据的存储和提取，服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能，这样我们可以根据自己的需要，来选取合适的存储引擎。
存储层：主要是将数据存储在文件系统之上，并完成与存储引擎的交互。

1.2 存储引擎

1、概念

存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表的，而不是基于库的，所以存储引擎也可以称为表类型。

在创建表时，指定存储引擎

create table 表名（
   字段1 字段1类型 [comment 字段1注释],
   字段2 字段2类型 [comment 字段2注释]
）engine = innodb [comment 表注释];

查看当前数据库支持的存储引擎

show engines;

2、InnoDB

介绍

InnoDB是一种兼顾高可靠性和高性能的通用存储引擎，在MySQL5.5之后，InnoDB是默认的MySQL存储引擎。
特点

DML操作遵循ACID模型（原子性、一致性、隔离性、持久性），支持事务；

行级锁，提高并发访问性能；

支持外键FOREIGN KEY约束，保证数据的完整性和正确性；
文件

xxx.ibd:xxx代表的是表名，innoDB引擎的每张表都会对应这样一个表空间文件，存储该表的表结构（frm,sdi）、数据和索引。

参数：innodb_file_per_table
逻辑存储结构

3、MyISAM

介绍

MyISAM是MySQL早期的默认存储引擎
特点

不支持事务，不支持外键

支持表锁，不支持行锁

访问速度快
文件

xxx.sdi:存储表结构信息

xxx.MYD:存储数据

xxx.MYI:存储索引

4、Memory

介绍

Memory引擎的表数据是存储在内存中的，由于受到硬件问题、或断电问题的影响，只能将这些表作为临时表或者缓存使用。
特点

内存存放

hash索引（默认）
文件

xxx.sdi:存储表结构信息

5、三种引擎对比

6、引擎的选择

在选择存储引擎时，应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统，还可以根据实际情况选择多种存储引擎进行组合。一般我们常常使用InnoDB，MyISAM一般都被MongoDB替代，Memory一般都别Redis替代。

InnoDB：是MySQL的默认存储引擎，支持事务、外键、行锁。如果应用对事务的完整性有比较高的要求，在并发条件下要求数据的一致性，数据操作除了插入和查询之外，还包含很多的更新、删除操作，那么InnoDB存储引擎是比较合适的选择。
MyISAM:如果应用是以读操作和插入操作为主，只有很少的更新和删除操作，并且对事务的完整性、并发性要求不是很高，那么选择这个存储引擎是非常合适的。
Memory：将所有数据保存在内存中，访问速度快，通常用于临时表及缓存。Memory的缺陷就是对表的大小有限制，太大的表无法缓存在内存中，并且无法保证数据的安全性。

1.3 安装mysql（Linux版本）

我用docker安装的

参考：Linux中使用Docker安装MySQL5.7_linux docker mysql5.7_不会调制解调的猫的博客-CSDN博客

二索引

1、概念

索引（index）是帮助MySQL数据库高效获取数据的数据结构（有序）

2、优缺点

优势	劣势
提高数据检索的效率，降低数据的IO成本	索引列也占用空间
通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗	索引大大提高了查询效率，同时也降低了更新表的速度，如对表进行INSERT、UPDATE、DELETE时，效率降低

3、索引结构

1、存储引擎-索引支持情况

2、为什么要使用B+tree

1、二叉树

2、多路平衡查找树 B-tree

3、B+tree

相对比B-tree区别：

所有数据都会出现在叶子节点

叶子节点形成了一个单向链表

非叶子节点只是起到索引作用

4、数据库MySQL中B+tree

MySQL索引数据结构是对经典的B+Tree进行了优化。在原B+Tree的基础上，增加一个相邻叶子节点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问的性能

5、hash

hash索引特点

hash索引只能用于对等比较，不支持范围查询
无法利用索引完成排序操作无序的
查询效率高，通常只需要一次建检索就可以了，效率通常要高于B+Tree索引

存储引擎支持

在MySQL中，支持hash索引的是Memory引擎，而InnoDB中具有自适应hash功能，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的

3、为什么InnoDB存储引擎选择使用B+tree索引结构

搜索二叉树，顺序存储的时候会出现链表
红黑树解决了顺序存储链表情况，但是数据量大的时候会出现层数过大，效率不高
hash索引不支持范围匹配和排序操作
B-tree，无论叶子节点还是非叶子节点，都会保存数据，一个页的大小16k是固定的，这样会导致一页存储的键值减少，指针也跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低

4、索引分类

1 分类

2 在InnoDB中索引分类

聚集索引选取规则：

如果存在主键，主键索引就是聚集索引
如果不存在主键，将使用第一个唯一索引作为聚集索引
如果表没有主键，或没有合适的唯一索引，则InnoDB会自动生成一个rowid作为隐藏的聚集索引

3 回表查询

先在二级索引进行查询到主键或者唯一值，然后通过这个值在聚集索引查找行数据

5、索引语法

name字段为姓名字段，该字段可能会重复，为该字段创建索引

create index idx_user_name on tb_user(name);

phone手机号字段的值，是非空，且唯一的，为该字段创建唯一索引

create unique index idx_user_phone on tb_user(phone);

为age。status创建联合索引

create index idx_user_age_status on tb_user(age,user);

查找表中所有索引

show index from tb_user;

删除tb_user表中的tb_user_name的索引

drop index tb_user_name on tb_user;

6、SQL性能分析

一般我们主要是对select多的数据库进行优化的

1、查看执行频次

MySQL客户端连接成功后，通过show [session|global] status 命令可以提供服务器状态信息，通过如下指令，可以查看当前数据库的insert、update、delete、select的访问频次；

show global status like 'Com___'; -->是七个下划线

2、慢查询日志

如果查询到该数据库select频次比较高，然后我们通过慢查询日志定位到指定select语句进行优化

慢查询日志记录了所有执行时间超过指定参数（long_query_time，单位：秒，默认10秒）的所有SQL语句的日志

MySQL的慢查询日志默认没有开启，需要在MySQL的配置文件（/etc/my.cnf）中配置如下信息：

# 开启Mysql慢查询日志开关
slow_query_log=1
# 设置慢查询日志的时间为2秒，SQL语句执行时间超过2面，就会视为慢查询，记录到慢查询日志中
long_query_time=2

配置完毕之后，通过以下指令重新启动MySQL服务进行测试

systemctl restart mysqld

查慢日志文件中记录的信息

 cd /var/lib/mysql  
 cat localhost-slow.log

实时查看尾部新增数据

tail -f localhost-slow.log

查询慢查询日志是否开启

show variables like 'slow_query_log';

3、profile详情

show profiles能够在SQL优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling参数，能够看到当前MySQL是否支持profile操作

select @@have_profiling;

默认profiling是关闭的，可以通过set语句在session/global级别开启profiling

查看profiling是否开启 select @@profiling；

设置profiling开启 set profiling = 1；

# 查看每一套SQL的耗时基本情况
show profiles;
# 查看指定query_id的SQL语句各个阶段的耗时情况
show profile for query query_id;
# 查看之情query_id的SQL语句CPU的使用情况
show profile cpu for query query_id

4、explain 执行计划

explain或者desc命令获取mysql如果执行select语句的信息，包括在select语句执行过程找那个表如何连接和连接的顺序。

语法：

# 直接在select语句之前加上关键字explain/desc
explain select 字段列表 from 表名 where 条件;

explain执行计划各字段含义：

id：select查询的序列号，表示查询中执行select语句或者操作表的顺序（id相同，从上到下；id不同，值越大，越先执行）
select_type:表示select的类型，常见的取值simple（简单表，即不使用表连接或者子查询）、primary（主查询，即外层的查询）、union（union中的第二个或者后面的查询语句）、subquery（select/where 之后包含了子查询）等（了解，意义不大）
type：表示连接类型，性能由好到差的连接类型为null、system、const、eq_ref、ref、range、index、all
possible_key:显示可能应用在这张表上的索引，一个或多个
key：实际使用的索引，如果为null，则没有使用索引
key_len:表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好
rows：mysql认为必须要执行查询的行数，在innodb引擎的表中，是一个估计值，可能并不总是准确的。
filtered：表示返回结果的行数占需读取行数的百分比，filtered的值越大越好

7、索引使用

①、使用原则

1、最左前缀法则（联合索引）

如果索引了多列（联合索引），要遵循最左前缀法则（存在就可，跟and顺序无关）。

最左前缀法则指的是查询从索引的最左列开始，并且不跳过索引中的列

如果没有最左边的 ---不使用索引

如果跳跃某一列，索引将从跳跃那一列后面的索引都部分失效。

2、范围查询（联合索引）

联合索引中，出现范围查询（<,>）,范围查询右侧的索引失效

如：

第一个就是 status失效第二个没有失效

因此当业务允许的情况下，尽量使用>=或者 <=的范围查询

3、索引列运算

不要在索引列上进行运算操作或者函数，或者索引将失效

4、字符串不加引号

字符串类型字段使用时，不加引号，索引将失效

5、模糊查询

如果仅仅是尾部模糊匹配，索引不会失效。只要有头部模糊匹配，索引失效

即xx% 不会失效、 %xx 或者 %xx%都会失效

6、or连接的条件

用or分割开的条件，如果or前的条件中的列有索引，而后面的列中没有索引，那么涉及的索引也不会被用到

7、数据分布影响

如果MySQL评估使用索引比全表更慢，则不使用索引

8、覆盖索引

尽量使用覆盖索引（查询使用了索引，并且需要返回的列，在该索引中已经全部能够找到）（即尽量不进行回表查询）

9、前缀索引

当字符类型为字符串时，有时候需要索引很长的字符串，这会让索引变得很大，查询时，浪费大量的磁盘IO，影响查询效率。此时可以只将字符串的一部分前缀，建立索引，这样可以大大节约索引空间，从而提高索引效率

语法：

create index idx_xxx_n on table_name(column(n));

create index idx_user_email_5 on user(email(5));

前缀长度:

可以根据索引的选择性来决定，而选择性是指不重复的索引值和数据表记录总数的比值，索引选择性越高则查询效率越高，唯一索引的选择性是1，这是最好的索引选择性，性能也是最好的。

select count(distinct email /count(*)) from tb_user
select count(distinct substring(email,1,5)/count(*)) from tb_user

10、单列索引与联合索引

单列索引：即一个索引只包含单个列

联合索引：即一个索引包含了多个列

在业务场景中，如果存在多个查询条件，考虑针对与查询字段建立索引时，建议建立联合索引，而非单列索引

先查找phone，phone相同的时候在查找name

②、SQL提示

SQL提示，是优化数据库的一个重要手段，简单来说，就是在SQL语句中加入一些认为的提示来达到优化操作的目的

8、索引设计原则

针对数据量大，且查询比较频繁的表建立索引
针对于常作为查询条件（where）、排序（order by）、分组（group by）操作的字段建立索引
尽量选择区分度高的列作为索引，尽量建立唯一索引，区分度越高，使用索引的效率越高。
如果是字符串类型的字段，字段的长度较长，可以针对于字段的特点，建立前缀索引。
尽量使用联合索引，减少单列索引，查询时，联合索引很多使用可以覆盖索引，节省存储空间，避免回表，提高查询效率
要控制索引的数量，索引并不是多多益善，索引越多，维护索引结构的代价也就越大，会影响增删改的效率。
如果索引列不能存储NULL值，请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时，它可以更好地确定那个索引最有效地用于查询

三、SQL优化

1、插入数据

1.1 insert优化

批量插入(一般建议一次批量插入500-1000)

如果一个个插入，每一个插入都要用于数据库建立连接网络传输，效率比较慢

insert info tb_user valuses(1,"zhangsna"),(2,"wangwu");

手动提交数据

start transaction
insert info tb_user valuses(1,"zhangsna"),(2,"wangwu"),.....;
insert info tb_user valuses(3,"zhangsna"),(4,"wangwu"),.....;
insert info tb_user valuses(5,"zhangsna"),(6,"wangwu"),.....;
commit;

主键顺序插入

主键顺序插入：1 2 3 4 7 20 34 55；

1.2 大批量插入数据

如果一次性需要插入大批量数据，使用insert语句初入性能较低，此时可以使用MySQL数据库体用load指令进行初入，操作如下：

# 客户端连接服务器时，加上参数 --local-infile -u root -p 
mysql --local-infile -u root -p
# 设置全局参数local_infile为1 ，开启从本地加载文件导入数据的开关
set global local_infile = 1;
# 执行load指令将准备好的数据，加载到表结构中
load data local infile '/root/wwtt.sql' into table 'tb_user' fields terminated by ',' lines terminated by '\n';

主键顺序插入性能高于乱序插入

2、主键优化

2.1 数据组织方式

在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表

2.2 页分裂

页可以为空，也可以填充一半，也可以填充100%。每个页包含了2 ~ n行数据（如果一行数据过大，会造成行溢出），根据主键排列

（1#page 分裂50%）

2.3 页合并

当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记为删除并且它的空间变得允许被其他记录声明使用。当页中删除的记录达到meger_threshold (默认为页的50%)，InnoDB会开始寻找最靠近的页（前或后）看看是否可以讲两个页合并以优化空间

2.4 主键设计原则

满足业务需求的情况下，尽量降低主键长度（主键索引只有一个，但是二级索引（非聚集索引）有很多，并且都是关联着主键，如果过长会增加IO成本）
插入数据时，尽量选择顺序插入，选择使用auto_increament自增主键（防止页分裂）
尽量不要使用UUID做主键或者其他自然主键，如身份证。（避免主键过长和非顺序插入）
业务操作时，避免对主键的修改（会修改对应的索引结构）

3、order by 优化

① Using filesort：通过表的索引或全表扫描，读取满足条件的数据行，然后在排序缓冲区sort buffer中完成排序操作，所有不是通过索引直接返回排序结果的排序都叫FileSort排序

② Using index：通过有序索引顺序扫描直接返回有序数据，这种情况基于using index，不需要额外排序，操作效率高

默认创建索引的时候都asc 升序排列

总结：

根据排序字段建立合适的索引，多字段排序时，也遵循最左前缀法则。
尽量使用覆盖索引
多字段排序，一个升序一个降序，此时需要注意联合索引在创建时的规则（ASE/DESC）
如果不可避免的出现filesort，大数据量排序时，可以适当增大排序缓冲区大小 sort_buffer_size

show variables like 'sort_buffer_size'

4、group by 优化

在分组操作时，可以通过索引来提高效率
分组操作时，索引的使用也是满足最左前缀法则的

5、limit优化

一个常见又非常头疼的问题就是limit 2000000，10，此时需要MySQL排序前2000010记录，仅仅返回2000000-20000010的记录，其他记录丢弃，查询排序的代价非常大。

优化思路：一般分页查询时，通过创建覆盖索引能够比较好地提高性能，可以通过覆盖索引加子查询形式进行优化

explain select t.* from tb_sku t ,(select id from tb_sku order by id limit 2000000,10) a where t.id = a.id;

6、count优化

count()是一个聚合函数，对于返回的结果集，一行行地判断，如果count函数的参数不是null，累计值就加1，否则不加，最后返回累计值。

用法：count(*)、count(主键)、count(字段)、count(1)

count(主键)

InnoDB引擎会遍历整张表，把每一行的主键id都取出来，返回给服务层。服务层拿到主键后，直接按行进行累加（主键不可能为null）
count（字段）

没有not null约束：InnoDB引擎会遍历整张表把每一行的字段值都取出来，返回给服务器，服务层判断是否为null，不为null，计数累加。

有not null约束：InnoDB引擎会遍历整张表把每一行的字段值都取出来，返回给服务层，直接按行累加。
count（1）

InnoDB引擎遍历整张表，但不取值。服务层对于返回的每一行，放一个数字‘1’进去，直接按行进行累加。
count（*）

InnoDB引擎并不会把全部字段取出来，而是专门专门做了优化，不取值，服务层直接按行进行累加。

按照效率排序的话，count(字段)<count(主键id)<count(1) 约等于count（* ），所以尽量使用count(*)

7、update优化

InnoDB的行锁是针对索引加的锁，不是针对记录加的锁，并且该索引不能失效，否则会从行锁升级为表锁

因此update的时候条件尽量使用索引字段，否则行锁升级为表锁，并发性能就降低

四、视图

1、介绍

视图是一种虚拟存在的表。视图中的数据并不在数据库中实际存在，行和列数据来自定义视图的查询中使用的表，并且在使用视图时动态生成的。

通俗的将，视图只保存了查询的SQL逻辑，不保存查询结果，所以我们在创建视图的时候，主要工作就落在创建这条SQL查询语句上

2、增删改查语法

创建

create [or replace] view 视图名称 as select语句 [with[cascaded|local]check option]

查询

查看创建视图语句
show create view 视图名称
查看视图数据
select * from 视图名称    ---跟查询表数据一样

修改

方式一：create or replace view 视图名称 as select语句[with[cascaded |local]check option]
方式二：alter view 视图名称 as  select语句[with[cascaded |local]check option]

删除
```
drop view [if exists] 视图名称
```

3、视图的检查选项

当使用with check option字句创建视图时，MySQL会通过视图检查正在更改的每个行，例如插入、更新、删除，以及其符号视图的定义。MySQL允许基于另一个视图创建视图，它会检查依赖视图中的规则以保持一致性。为了确定检查的范围，mysql提供了两个选项：cascaded和local，默认值为cascaded

cascaded：进行级联查询如果当前视图有检查，即使它依赖的视图没有检查，也要进行检查

local：进行递归查询如果有检查才会进行判断

4、视图更新的条件

要使视图可更新，视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含一下任意一项，则该视图不可个更新。

聚合函数或窗口函数（sum、min、max、count等）
distinct
group by
having
union或者union all

5、作用

简单：视图不仅可以简化用户对数据的理解，也可以简化他们的操作。那些被经常使用的查询可以被定义为视图，从而使得用户不必为以后的操作每次指定全部的条件。
安全：数据库可以授权，但不能授权到数据库特定的行和特定的列上。通过视图用户只能查询和修改他们所见到的数据
数据独立：视图可帮助用户屏蔽真实表结构变化带来的影响。

6、案例

类似这种应用都可以使用到视图

五、存储过程

1、介绍

存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合，调用存储过程可以简化应用开发人员的很多工作，减少数据在数据库和应用服务器之间的传输，对于提高数据处理的效率是有好处的。

存储过程思想上很简答，就是数据库SQL语言层面的代码封装与重用。

2、特点

封装，复用

可以接收参数，也可以返回数据

减少网络交互，效率提高

3、语法

创建：

create procedure 存储过程名称（[参数列表]）
begin
  ---一条或者多条SQL语句
end；

调用

call 名称（[参数]）

查看

select * from information_schema.routines where routine_schema = '数据库名' ;查询指定数据库的存储过程及状态信息
show create procedure 存储过程名称；

删除

drop procedure [if exists] 存储过程名称；

注意：在命令行中，执行创建存储过程的SQL时，需要通过关键字delimiter指定SQL语句的结束符

4、变量

4.1 系统变量

系统变量是MySQL服务器提供，不是用户定义的，属于服务器层面。分为全局变量（GLOBAL）、会话变量（SESSION）

查看系统变量

show [session | global] variables;  --查看所有系统变量
show [session | global] variables like '...' --可以通过like模糊匹配方式查找变量
select @@[session |global] 系统变量名； --查看指定变量的值

设置系统变量

set [session | global] 系统变量名 = 值；
set @@[session | global]系统变量名 = 值；

注意：

如果没有指定session/global，默认是session，会话变量

mysql服务重新启动之后，所设置的全局参数会失效，要想不失效，可以在/etc/my.cnf中配置

@@代表系统变量 @代表用户自定义变量

4.2 用户变量

用户定义变量是用户根据需要自己定义的变量，用户变量不用提前声明，在用的时候直接用@变量名使用即可。其作用域为当前连接

赋值

set @var_name = 'ww'
set @var_age := 11
select @var_gender := '女'
select 字段名 info @var_name from 表名

使用
```
select @var_name;
```

注意：用户定义的变量无序对其进行声明或初始化，只不过获取到的值为null

4.3 局部变量

局部变量是根据需要定义在局部生效的变量，访问之前，需要declare声明。可用做存储过程内的局部变量和输入参数，局部变量的范围是在其内声明的begin end块

声明
```
declare 变量名 变量类型 
```
变量类型就是数据库字段类型：int、tinyint、bigint、char、date等

赋值

set 变量名 = 值；
set 变量名 := 值；
select 字段名 into 变量名 from 表名；

5、流程控制

5.1 if

语法：

if 条件1 then

elseif 条件2 then 

else 

end if；

举例：

create procedure p1()
begin
    declare  score int default 58;
    declare  grade varchar(10);
    if score >= 85
        then set grade := '优秀';
    elseif score >= 60
        then set grade := '及格';
    else set grade := '不及格';
    end if;
    select  grade;
end;

call p1();

5.2 参数

类型	含义	备注
in	该类参数作为输入，也就是需要调用时传入值	默认
out	该类参数作为输出，也就是该参数可以作为返回值
inout	既可以作为输入参数，也可以作为输出参数

用法：

create procedure 存储过程名称([in/out/inout 参数名 参数类型])
begin
 -SQL语句
end;

举例：

create procedure p2(in score int ,out grade varchar(10))
begin
    if score >= 85
        then set grade := '优秀';
    elseif score >= 60
        then set grade := '及格';
    else set grade := '不及格';
    end if;

end;
 call p2(78,@grade);

select @grade;

5.3 case

实例：

5.4 while

while循环是有条件的循环控制语句。满足条件弧，再执行循环体中的SQL语句。具体语法为：

# 先判断条件，如果条件为true，则执行逻辑，否则，不执行逻辑
while 条件 do  
   SQL逻辑
end while;

举例：

create procedure  p3(in n int)
begin
    declare num int default 0;

    while n > 0 do
       set num := num + n;
       set n := n - 1;
        end while;
    select  num;
end;

5.5 repeat

5.6 loop

举例：

从1到n的累加

5.7 游标

游标是用来莻查询结果集的数据类型。在存储过程和函数中可以使用游标对结果集进行循环的处理。游标的使用包括游标的声明、open、fetch和close，其语法分别如下：

声明游标

declare 游标名称 cursor for 查询语句；

打开游标

open 游标名称；

获取游标记录

fetch 游标名称 into 变量

关闭游标

close 游标名称

5.8 条件处理程序

举例：

create procedure  p4(in uage int)
begin
    declare uname varchar(100);
    declare upro varchar(100);
    declare u_cursor cursor for select  name,profession from tb_user where  age <= uage;
    declare exit handler for  SQLSTATE  '02000' close  u_cursor;

    drop table  if exists  tb_user_pro;
    create table if not exists tb_user_pro (
        id int primary key auto_increment,
        name varchar(100) not null ,
        profession varchar(100) not null
    );

    open u_cursor;
    while true do
        fetch u_cursor into uname,upro;
        insert into tb_user_pro values (null,uname,upro);
        end while;
    close u_cursor;
end;

六、存储函数

存储函数是有返回值的存储过程，存储函数的只能是in类型的

create function 存储函数名称（[参数列表]）
returns 返回值类型 [characterisic..]
begin
  --sql语句
  return ...
end;

characteristic说明：
  deterministic:相同的输入参数总是产生相同的结果
  no sql：不包含sql语句
  reads sql date：包含读取数据的语句，但不包含写入数据的语句

select fun1(10);

不常用，存储函数都能用存储过程替代

七、触发器

7.1 概念

触发器是与表有关的数据库对象，指在insert/update/delete之前或之后，触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性，日志记录，数据校验等操作。

使用别名old和new来引用触发器中发生变化的记录内容，这与其他数据库是相似的。现在触发器还只支持行级触发，不支持语句级触发。

行级触发：语句影响了几行就触发几次

语句触发：一个语句不管影响几行，也触发一次

7.2 语法

创建：

create trigger  trigger_name 
before/after insert/update/delete
on 表名 for each row 
begin
   触发后要干的逻辑
end;

查看

show triggers;

删除

drop trigger [数据库名].trigger_name    -- 如果没有指定数据库名，默认为当前数据库

实例：

-- 创建数据库test
create database  test;
use  test;

-- 创建表test_log
create table  test_log (
    id int primary key  auto_increment,
    dml_type varchar(100) ,
    test varchar(200)
);

-- 创建表test_user
create table  test_user (
    id int primary key  auto_increment,
    name varchar(100) ,
    age int
);

-- 创建触发器trigger_na  当test_user出现插入之后 执行begin-end之间的逻辑
create trigger  trigger_na
    after  insert
    on test_user for each row
    begin
        insert test_log values (null,'insert',concat('id =',new.id,',name =',new.name));
    end;


insert into test_user (id, name, age)
values (null,'lisi',11);

-- 查看
show triggers ;

-- 删除
drop trigger test.trigger_na;

八、锁

8.1 概念

锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中除传统的计算资源（cpu、ram、I/O）的争用以外，数据也是一个供多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题，锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说，锁对数据库而言显得尤为重要，也更加复杂。

8.2 分类

MySQL中的锁，按照锁的粒度分，分为以下三类：

全局锁：锁定数据库中的所有表
表级锁：每次操作锁住整张表
行级锁：每次操作锁住对应的行数据

8.3 全局锁

全局锁就是对整个数据库实现加锁，加锁后整个实例就处于只读状态，后续的DML的写语句，DDL语句，已经更新操作的事务提交语句都将被阻塞。

其典型的使用场景是做全库的逻辑备份，对所有表进行锁定，从而获取一致性视图，保证数据的完整性。

不加锁情况：

加锁后情况：

直接在windows中连接虚拟机数据库然后将进行备份

-h虚拟机地址 -P端口 -u用户名 -p密码 test是数据库名称（准备备份的数据吗）后面的是备份地址

特点：

数据库中加全局锁，是一个比较重的操作，存在一下问题：

如果在主库上备份，那么备份期间都不能执行更新，业务基本上停摆
如果在从库上备份，那么在备份期间从库不能执行主库同步过来的二进制日志（binlog），会导致主从延迟。

在InnoDB引擎中，我们可以在备份时加上参数 --single-transaction参数来完成不加锁的一致性数据备份。

mysqldump --single-transaction -uroot -p123456 test > d:/testcopy.sql

8.4 表级锁

表级锁，每次操作锁住整张表。锁定粒度大，发生锁冲突的概率最高，并发度最低。应用在MyISAM、InnoDB等存储引擎汇总。

对于表级锁，主要分为以下三类：

表锁
元数据锁（meta data lock，MDL）
意向锁

1、表锁

对于表锁，分为两类：

表共享读锁（read lock）     ---  SHARED_READ_ONLY

表独占写锁（write lock） --- SHARED_NO_READ_WRITE

语法：

加锁：lock tables 表名 read/write

释放锁：unlock tables 或者客户端断开连接

红色代表不可以，绿色代表可以

读锁不会阻塞其他客户端的读，但是会阻塞写。

写锁既会阻塞其他客户端的读，也会阻塞其他客户端的写

2、元数据锁（meta data lock ，MDL）

MDL加锁过程是系统自动控制，无序显示使用，在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据（元数据可以说是表结构）的数据一致性，在表上有活动事务的时候，不可以对元数据进行写入操作。为了避免DML和DDL冲突，保证读写的正确性。

在 MySQL5.5中引入MDL，当对一张表进行增删改查的时候，加入MDL读锁

当对表结构进行变更的时候，加MDL写锁（排他）

查看元数据锁

select object_type,object_schema,object_name,lock_type,lock_duration from performance_schema.metadata_locks;

3、意向锁

为了避免DML在执行时，加的行锁与表锁的冲突，在InnoDB中引入了意向锁，使得表锁不用检查每行数据是否加锁，使用意向锁来减少表锁的检查

分类：

1.意向共享锁（IS）：由语句select...lock in share mode添加，与表锁共享锁（read）兼容，与表锁排它锁write互斥

2.意向排他锁（IX）：有insert、update、delete、select...for dupate添加，与表锁共享锁（read）及排它锁（write）都互斥。意向锁之间不会互斥。

8.5 行级锁

行级锁，每次操作锁住对应的行数据。锁定粒度最小，发生锁冲突的概率最低，并发度最高。应用在InnoDB存储引擎中。

InnoDB的数据是基于索引组织的，行锁是通过对索引上的索引项加锁来实现的，而不是对记录加的锁。对于行级锁，主要分为以下三类：

行锁（Record Lock）：锁定单个记录的锁，防止其他事务对此进行update和delete。在Read committed、Repeatable Read隔离级别下都支持
间隙锁（Gap Lock)：锁定索引记录间隙（不含该记录），确保索引记录间隙不变，防止其他事务在这个间隙进行insert，产生幻读。在Repeatable Read隔离级别下都支持。
临键锁（Next-key Lock）：行锁和间隙锁组合，同时锁住数据，并锁住数据前面的间隔Gap。在RR隔离级别下支持

1、行锁

InnoDB实现了一下两种类型的行锁：

共享锁（S）：允许一个事务去读一行，阻止其他事务获取相同数据集的排它锁
排他锁（X）：允许获取排他锁的事务更新数据，阻止其他事务获得相同数据集的共享锁和排他锁。

查看意向锁和行级锁

select object_schema,object_name,index_name,lock_type,lock_mode,lock_data from performance_schema.data_locks;

默认情况下，InnoDB在 Repeatable read事务隔离级别运行，InnoDB使用next-key 临键锁 进行搜索和索引扫描，以防止幻读。

针对唯一索引进行检索（updatedelete）时，对已存在的记录进行等值匹配时，将会自动优化为行锁
InnoDb的行锁是针对索引加的锁，不通过索引条件检索数据，那么InnoDb将对表中所有数据加锁，此时就相当于表锁了

2、间隙锁/临键锁

默认情况下，InnoDB在Repeatable Read事务隔离级别下运行，InnoDB使用next-key锁进行搜索和索引扫描，以防止幻读。

索引上的等值查询（唯一索引），给不存在的记录加锁时，优化为间隙锁。
索引上的等值查询（普通索引），向右遍历时最后一个值不满足查询需求。
索引上的范围查询（唯一索引），会访问到不满足条件的第一个值为止。

注意：间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存，一个事务采用的间隙锁，不会组织另一个事务在同一间隙上采用间隙锁

九、InnoDB引擎

1、逻辑结构

2、架构

MySQL5.5版本开始，默认使用InnoDB存储引擎，它擅长事务处理，具有崩溃恢复特性，在日常开发中使用非常广泛。下面是InnoDB架构图，左侧为内存结构，右侧为磁盘结构

2.1 内存结构

Buffer pool：缓冲池是主内存中的一个区域，里面可以缓存磁盘上经常操作的真实数据，在执行增删改查操作时，先操作缓冲池中的数据（若缓冲池没有数据，则从磁盘加载并缓存），然后再以一定频率刷新到磁盘，从而减少磁盘IO，加快处理速度。

缓冲池以Page页为单位，底层采用链表数据结构管理Page。根据状态，将Page分为三种类型：

free page：空闲page，未被使用。
clean page：被使用page，数据没有被修改过。
dirty page：脏页，被使用page，数据被修改过，数据与磁盘的数据产生了不一致

Change Buffer：更改缓冲区（针对于非唯一二级索引页），在执行DML语句时，如果这些数据Page没有在Buffer Pool中，不会会直接操作磁盘，而会将数据变更在更新缓存区Change Buffer中，在未来数据被读取时，在将数据合并恢复到Buffer Pool中，再将合并后的数据刷新到磁盘中。

Change Buffer的意义是什么？

与聚集索引不同，二级索引通常是非唯一的，并且以相对随机的顺序插入二级索引。同样，删除和更新可能会影响索引树中不相邻的二级索引页，如果每一次都操作磁盘，会造成大量的磁盘IO。有了Change Buffer之后，我们可以在缓冲池中进行合并处理，减少磁盘IO

Adaptive Hash Index：自适应hash索引，用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控表上各索引页的查询，如果观察到hash索引可以提升速度，则建立hash索引，称之为自适应hash索引。

自适应哈希索引，无序人工干预，是系统根据情况自动完成

参数：adaptive_hash_index

show variables like '%adaptive_hash_index%';

Log Buffer:日志缓冲区，用来保存要写入到磁盘中的log日志数据（redo log、undo log），默认大小为16MB,日志缓冲区的日志会定期刷新到磁盘汇总。如果需要更新、插入或删除许多行的事务，增加日志缓冲区的大小可以节省磁盘I/O

参数：

innodb_log_buffer_size:缓冲区大小

innodb_flush_log_at_trx_commit：日志刷新到磁盘时机

1：日志在每次事务提交时写入并刷新到磁盘
0：每秒将日志写入并刷新到磁盘一次
2：日志在每次事务提交后写入，并每秒刷新到磁盘一次

show variables  like '%innodb_log_buffer_size'
show variables like '%innodb_flush_log_at_trx_commit'

2.2 磁盘结构

System Tablespace：系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建的，它也可能包含表和索引数据（在MySQL5.X版本中还包含InnoDB数据字典、undolog等）

参数：innodb_data_file_path

show variables like '%innodb_data_file_path'

File-Per-Table Tablespaces:每个表的文件表空间包含单个InnoDb表的数据和索引，并存储在文件系统上的的那个数据文件中。 .ibd文件

参数：innodb_file_par_table

show variables like '%innodb_file_per_table'

General Tablespaces：通用表空间，需要通过create tbalespace 语法创建通用表空间，在创建表的时候，可以指定该表空间

create tablespace ts_test add datafile  'wintertest.ibd' engine = innodn;

create table  a (
    id int primary key auto_increment,
    name varchar(20) not null
) engine = innodb tablespace ts_test;

Undo Tablespaces：撤销表空间，MySQL实例在初始化时会自动创建两个默认undo表空间（初始大小16M），用于存储undo log 日志 undo_001, undo_002

Temporary Tablespaces:InnoDB使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据

Doublewrite Buffer Files：双写缓冲区，innoDB引擎将数据页从Buffer Pool刷新到磁盘前，先将数据页写入双写缓冲区文件中，便于系统异常时恢复数据。

#ib_16384_0.dblwr,#ib_16384_1.dblwr

Redo Log:重做日志，是用来实现事务的持久性。该日志文件由两部分组成：重写缓冲（redo log buffer）以及重做日志文件（redo log），前者是在内存中，后者在磁盘中。当时事务提交之后会把所有修改信息都会存到该日志中，用于刷新脏页到磁盘时，发生错误时，进行数据恢复使用。

以循环方式重写日志文件，涉及两个文件：ib_logfile0 , ib_logfile1

2.3 后台线程

Master Thread

核心后台线程，负责调度其他线程，还负责将缓冲池中的数据异步刷新到磁盘中，保持数据的一致性，还包括脏页的刷新、合并插入缓存、undo页的回收
IO Thread

在InnoDB存储引擎中大量使用AIO来处理IO请求，这样可以极大地提高数据库的性能，而IO Thread主要负责这些IO请求的回调。

线程类型默认个数职责
Read thread 4 负责读操作
Write thread 4 负责写操作
Log thread 1 负责将日志缓冲区刷新到磁盘
Insert buffer thread 1 负责将写缓冲区内容刷新到磁盘
Purge Thread

主要用于回收事务已经提交的undo log ，在事务提交之后，undo log可能不用了，就用它来回收
Page Cleaner Thread

协助Master Thread 刷新脏页到磁盘的线程，它可以减轻Master Thread的工作压力，减少阻塞

线程类型	默认个数	职责
Read thread	4	负责读操作
Write thread	4	负责写操作
Log thread	1	负责将日志缓冲区刷新到磁盘
Insert buffer thread	1	负责将写缓冲区内容刷新到磁盘

3、事务原理

事务：事务是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。

特性：

原子性(Atomicity)：事务是不可分割的最小操作单元，要么全部成功，要么全部失败。
一致性(Consistency):事务完成时必须使所有的数据都保持一致状态。
隔离性(Isolation)：数据库系统提供的隔离机制，保证事务在不受外部并发操作影响的独立环境下运行。
持久性(Durability)：事务一旦提交或回滚，它对数据库中的数据的改变就是永久的。

3.1 redo log

重做日志，记录的是事务提交时数据页的物理修改，是用来里实现事务的持久性。

该日志文件由两部分组成：重做日志缓冲（redo log buffer）及重做日志文件（redo log file），前者是在内存中，后者是在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中，用于刷新脏页到磁盘，发生错误时，进行数据恢复使用。

3.2 undo log

回滚日志，用于记录数据被修改前的信息，作用包含两个：提供回滚和MVCC（多版本并发控制）

undo log和redo log 记录物理日志不一样，它是逻辑日志，可以认为当delete一条记录时，undo log 中会记录一条对应的insert记录，反之亦然，当update一条记录时，它记录一条对应相反的update记录。当执行rollback时，乐园从undo log中的逻辑记录读取到响应的内容并进行回滚。

undo log 销毁：undo log 在事务执行时产生，事务提交时，并不会立即删除undo log ，因为这些日志可能还用于MVCC

undo log 存储：undo log 采用段的方式进行管理和记录，存放在前面介绍的rollback segment回滚段中，内部包含1024个undo log segment

4、MVCC

4.1 基本概念

当前读

读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。对于我们日常的操作，如：select ... lock in share mode(共享锁)，select ... for update 、update、insert、delete（排他锁）都是一种当前读
快照读

简单的select（不加锁）就是快照读，快照读读到的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读。
- Read Committed：每次select，都生产一个快照读
- Repatable Read：开启事务后第一个select语句才是快照读的地方。
- Serializable：快照读会退化为当前读。
MVCC

全称Multo-Version Concurrentcy Control,多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突，快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现，还需要依赖与数据记录中的是哪个隐式字段、undo log日志、readView

4.2 MVCC实现原理

隐藏字段

隐藏字段	含义
DB_TRX_ID	最近修改事务ID，记录插入这条记录或最后一次修改该记录的事务ID
DB_ROLL_PTR	回滚指针，指向这条记录的上一个版本，用于配合undo log，指向上一个版本
DB_ROW_ID	隐藏主键，如果表结构没有指定主键，将会生成该隐藏字段

如果有主键就没有该字段DB_ROW_ID

undo log

回滚日志在，在insert、update、delete的时候产生的便于数据回滚的日志。

当insert的时候，产生的undo log 日志只在回滚时需要，在事务提交后，可被立即删除

而update、delete的时候，产生的undo log 日志不仅在回滚时需要，在快照时也需要，不会立即被删除

undo log版本链

不同事务或相同事务对同一条记录进行修改，会导致该记录的undolog生成一条记录版本链表，链表的头部是最新的旧记录，链表的尾部是最早的旧记录

ReadView

ReadView（读视图）是快照读SQL执行时MVCC提供数据的依据，记录并维护系统当前活跃的事务id

字段	含义
m_ids	当前活跃的事务ID记录（未提交的事务）
min_trx_id	最小活跃事务ID
max_trx_id	预分配事务ID，当前最大事务ID+1（因为事务ID是自增的）
creator_trx_id	ReadView创建者的事务ID