目录
MySQL进阶篇
一、存储引擎
1.1 Mysql体系结构图
-
连接层:最上层是一些客户端和链接服务,主要完成一些类似于连接处理、授权认证、及相关安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
-
服务层:第二次架构主要完成大多数的核心服务功能,如SQL接口,并完成缓存,SQL的分析和优化,部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。
-
引擎层:存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样我们可以根据自己的需要,来选取合适的存储引擎。
-
存储层:主要是将数据存储在文件系统之上,并完成与存储引擎的交互。
1.2 存储引擎
1、概念
存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式。存储引擎是基于表的,而不是基于库的,所以存储引擎也可以称为表类型。
-
在创建表时,指定存储引擎
create table 表名( 字段1 字段1类型 [comment 字段1注释], 字段2 字段2类型 [comment 字段2注释] )engine = innodb [comment 表注释];
-
查看当前数据库支持的存储引擎
show engines;
2、InnoDB
-
介绍
InnoDB是一种兼顾高可靠性和高性能的通用存储引擎,在MySQL5.5之后,InnoDB是默认的MySQL存储引擎。
-
特点
DML操作遵循ACID模型(原子性、一致性、隔离性、持久性),支持事务;
行级锁,提高并发访问性能;
支持外键FOREIGN KEY约束,保证数据的完整性和正确性;
-
文件
xxx.ibd:xxx代表的是表名,innoDB引擎的每张表都会对应这样一个表空间文件,存储该表的表结构(frm,sdi)、数据和索引。
参数:innodb_file_per_table
-
逻辑存储结构
3、MyISAM
-
介绍
MyISAM是MySQL早期的默认存储引擎
-
特点
不支持事务,不支持外键
支持表锁,不支持行锁
访问速度快
-
文件
xxx.sdi:存储表结构信息
xxx.MYD:存储数据
xxx.MYI:存储索引
4、Memory
-
介绍
Memory引擎的表数据是存储在内存中的,由于受到硬件问题、或断电问题的影响,只能将这些表作为临时表或者缓存使用。
-
特点
内存存放
hash索引(默认)
-
文件
xxx.sdi:存储表结构信息
5、三种引擎对比
6、引擎的选择
在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。一般我们常常使用InnoDB,MyISAM一般都被MongoDB替代,Memory一般都别Redis替代。
-
InnoDB:是MySQL的默认存储引擎,支持事务、外键、行锁。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。
-
MyISAM:如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
-
Memory:将所有数据保存在内存中,访问速度快,通常用于临时表及缓存。Memory的缺陷就是对表的大小有限制,太大的表无法缓存在内存中,并且无法保证数据的安全性。
1.3 安装mysql(Linux版本)
我用docker安装的
参考:Linux中使用Docker安装MySQL5.7_linux docker mysql5.7_不会调制解调的猫的博客-CSDN博客
二 索引
1、概念
索引(index) 是帮助MySQL数据库高效获取数据的数据结构(有序)
2、优缺点
优势 | 劣势 |
---|---|
提高数据检索的效率,降低数据的IO成本 | 索引列也占用空间 |
通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗 | 索引大大提高了查询效率,同时也降低了更新表的速度,如对表进行INSERT、UPDATE、DELETE时,效率降低 |
3、索引结构
1、存储引擎-索引支持情况
2、为什么要使用B+tree
1、二叉树
2、多路平衡查找树 B-tree
3、B+tree
相对比B-tree区别:
所有数据都会出现在叶子节点
叶子节点形成了一个单向链表
非叶子节点只是起到索引作用
4、数据库MySQL中B+tree
MySQL索引数据结构是对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能
5、hash
hash索引特点
-
hash索引只能用于对等比较,不支持范围查询
-
无法利用索引完成排序操作 无序的
-
查询效率高,通常只需要一次建检索就可以了,效率通常要高于B+Tree索引
存储引擎支持
在MySQL中,支持hash索引的是Memory引擎,而InnoDB中具有自适应hash功能,hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的
3、为什么InnoDB存储引擎选择使用B+tree索引结构
-
搜索二叉树,顺序存储的时候会出现链表
-
红黑树解决了顺序存储链表情况,但是数据量大的时候会出现层数过大,效率不高
-
hash索引不支持范围匹配和排序操作
-
B-tree,无论叶子节点还是非叶子节点,都会保存数据,一个页的大小16k是固定的,这样会导致一页存储的键值减少,指针也跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低
4、索引分类
1 分类
2 在InnoDB中索引分类
聚集索引选取规则:
-
如果存在主键,主键索引就是聚集索引
-
如果不存在主键,将使用第一个唯一索引作为聚集索引
-
如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引
3 回表查询
先在二级索引进行查询到主键或者唯一值,然后通过这个值在聚集索引查找行数据
5、索引语法
name字段为姓名字段,该字段可能会重复,为该字段创建索引
create index idx_user_name on tb_user(name);
phone手机号字段的值,是非空,且唯一的,为该字段创建唯一索引
create unique index idx_user_phone on tb_user(phone);
为age。status创建联合索引
create index idx_user_age_status on tb_user(age,user);
查找表中所有索引
show index from tb_user;
删除tb_user表中的tb_user_name的索引
drop index tb_user_name on tb_user;
6、SQL性能分析
一般我们主要是对select多的数据库进行优化的
1、查看执行频次
MySQL客户端连接成功后,通过show [session|global] status 命令可以提供服务器状态信息,通过如下指令,可以查看当前数据库的insert、update、delete、select的访问频次;
show global status like 'Com___'; -->是七个下划线
2、慢查询日志
如果查询到该数据库select频次比较高,然后我们通过慢查询日志定位到指定select语句进行优化
慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志
MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:
# 开启Mysql慢查询日志开关 slow_query_log=1 # 设置慢查询日志的时间为2秒,SQL语句执行时间超过2面,就会视为慢查询,记录到慢查询日志中 long_query_time=2
配置完毕之后,通过以下指令重新启动MySQL服务进行测试
systemctl restart mysqld
查慢日志文件中记录的信息
cd /var/lib/mysql cat localhost-slow.log
实时查看尾部新增数据
tail -f localhost-slow.log
查询慢查询日志是否开启
show variables like 'slow_query_log';
3、profile详情
show profiles能够在SQL优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling参数,能够看到当前MySQL是否支持profile操作
select @@have_profiling;
默认profiling是关闭的,可以通过set语句在session/global级别开启profiling
查看profiling是否开启 select @@profiling;
设置profiling开启 set profiling = 1;
# 查看每一套SQL的耗时基本情况 show profiles; # 查看指定query_id的SQL语句各个阶段的耗时情况 show profile for query query_id; # 查看之情query_id的SQL语句CPU的使用情况 show profile cpu for query query_id
4、explain 执行计划
explain或者desc命令获取mysql如果执行select语句的信息,包括在select语句执行过程找那个表如何连接和连接的顺序。
语法:
# 直接在select语句之前加上关键字explain/desc explain select 字段列表 from 表名 where 条件;
explain执行计划各字段含义:
-
id:select查询的序列号,表示查询中执行select语句或者操作表的顺序(id相同,从上到下;id不同,值越大,越先执行)
-
select_type:表示select的类型,常见的取值simple(简单表,即不使用表连接或者子查询)、primary(主查询,即外层的查询)、union(union中的第二个或者后面的查询语句)、subquery(select/where 之后包含了子查询)等 (了解,意义不大)
-
type:表示连接类型,性能由好到差的连接类型为null、system、const、eq_ref、ref、range、index、all
-
possible_key:显示可能应用在这张表上的索引,一个或多个
-
key:实际使用的索引,如果为null,则没有使用索引
-
key_len:表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好
-
rows:mysql认为必须要执行查询的行数,在innodb引擎的表中,是一个估计值,可能并不总是准确的。
-
filtered:表示返回结果的行数占需读取行数的百分比,filtered的值越大越好
7、索引使用
①、使用原则
1、最左前缀法则(联合索引)
如果索引了多列(联合索引),要遵循最左前缀法则(存在就可,跟and顺序无关)。
最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列
如果没有最左边的 ---不使用索引
如果跳跃某一列,索引将从跳跃那一列后面的索引都部分失效。
2、范围查询(联合索引)
联合索引中,出现范围查询(<,>),范围查询右侧的索引失效
如:
第一个就是 status失效 第二个没有失效
因此当业务允许的情况下,尽量使用>=或者 <=的 范围查询
3、索引列运算
不要在索引列上进行运算操作或者函数,或者索引将失效
4、字符串不加引号
字符串类型字段使用时,不加引号,索引将失效
5、模糊查询
如果仅仅是尾部模糊匹配,索引不会失效。只要有头部模糊匹配,索引失效
即xx% 不会失效 、 %xx 或者 %xx%都会失效
6、or连接的条件
用or分割开的条件,如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引也不会被用到
7、数据分布影响
如果MySQL评估使用索引比全表更慢,则不使用索引
8、覆盖索引
尽量使用覆盖索引(查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到)(即尽量不进行回表查询)
9、前缀索引
当字符类型为字符串时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO,影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率
语法:
create index idx_xxx_n on table_name(column(n)); create index idx_user_email_5 on user(email(5));
前缀长度:
可以根据索引的选择性来决定,而选择性是指不重复的索引值和数据表记录总数的比值,索引选择性越高则查询效率越高,唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。
select count(distinct email /count(*)) from tb_user select count(distinct substring(email,1,5)/count(*)) from tb_user
10、单列索引与联合索引
单列索引:即一个索引只包含单个列
联合索引:即一个索引包含了多个列
在业务场景中,如果存在多个查询条件,考虑针对与查询字段建立索引时,建议建立联合索引,而非单列索引
先查找phone,phone相同的时候在查找name
②、SQL提示
SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些认为的提示来达到优化操作的目的
8、索引设计原则
-
针对数据量大,且查询比较频繁的表建立索引
-
针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引
-
尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。
-
如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。
-
尽量使用联合索引,减少单列索引,查询时,联合索引很多使用可以覆盖索引,节省存储空间,避免回表,提高查询效率
-
要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。
-
如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定那个索引最有效地用于查询
三 、SQL优化
1、插入数据
1.1 insert优化
批量插入(一般建议一次批量插入500-1000)
如果一个个插入,每一个插入都要用于数据库建立连接网络传输,效率比较慢
insert info tb_user valuses(1,"zhangsna"),(2,"wangwu");
手动提交数据
start transaction insert info tb_user valuses(1,"zhangsna"),(2,"wangwu"),.....; insert info tb_user valuses(3,"zhangsna"),(4,"wangwu"),.....; insert info tb_user valuses(5,"zhangsna"),(6,"wangwu"),.....; commit;
主键顺序插入
主键顺序插入:1 2 3 4 7 20 34 55;
1.2 大批量插入数据
如果一次性需要插入大批量数据,使用insert语句初入性能较低,此时可以使用MySQL数据库体用load指令进行初入,操作如下:
# 客户端连接服务器时,加上参数 --local-infile -u root -p mysql --local-infile -u root -p # 设置全局参数local_infile为1 ,开启从本地加载文件导入数据的开关 set global local_infile = 1; # 执行load指令将准备好的数据,加载到表结构中 load data local infile '/root/wwtt.sql' into table 'tb_user' fields terminated by ',' lines terminated by '\n';
主键顺序插入性能高于乱序插入
2、主键优化
2.1 数据组织方式
在InnoDB存储引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表
2.2 页分裂
页可以为空,也可以填充一半,也可以填充100%。每个页包含了2 ~ n行数据(如果一行数据过大,会造成行溢出),根据主键排列
(1#page 分裂50%)
2.3 页合并
当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记为删除并且它的空间变得允许被其他记录声明使用。当页中删除的记录达到meger_threshold (默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以讲两个页合并以优化空间
2.4 主键设计原则
-
满足业务需求的情况下,尽量降低主键长度(主键索引只有一个,但是二级索引(非聚集索引)有很多,并且都是关联着主键,如果过长会增加IO成本)
-
插入数据时,尽量选择顺序插入,选择使用auto_increament自增主键(防止页分裂)
-
尽量不要使用UUID做主键或者其他自然主键,如身份证。(避免主键过长和非顺序插入)
-
业务操作时,避免对主键的修改(会修改对应的索引结构)
3、order by 优化
① Using filesort:通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫FileSort排序
② Using index: 通过有序索引顺序扫描直接返回有序数据,这种情况基于using index,不需要额外排序,操作效率高
默认创建索引的时候都asc 升序排列
总结:
-
根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。
-
尽量使用覆盖索引
-
多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASE/DESC)
-
如果不可避免的出现filesort,大数据量排序时,可以适当增大排序缓冲区大小 sort_buffer_size
show variables like 'sort_buffer_size'
4、group by 优化
-
在分组操作时,可以通过索引来提高效率
-
分组操作时,索引的使用也是满足最左前缀法则的
5、limit优化
一个常见又非常头疼的问题就是limit 2000000,10,此时需要MySQL排序前2000010记录,仅仅返回2000000-20000010的记录,其他记录丢弃,查询排序的代价非常大。
优化思路:一般分页查询时,通过创建覆盖索引能够比较好地提高性能,可以通过覆盖索引加子查询形式进行优化
explain select t.* from tb_sku t ,(select id from tb_sku order by id limit 2000000,10) a where t.id = a.id;
6、count优化
count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是null,累计值就加1,否则不加,最后返回累计值。
用法:count(*)、count(主键)、count(字段)、count(1)
-
count(主键)
InnoDB引擎会遍历整张表,把每一行的主键id都取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为null)
-
count(字段)
没有not null约束:InnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务器,服务层判断是否为null,不为null,计数累加。
有not null约束:InnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,直接按行累加。
-
count(1)
InnoDB引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字‘1’进去,直接按行进行累加。
-
count(*)
InnoDB引擎并不会把全部字段取出来,而是专门专门做了优化,不取值,服务层直接按行进行累加。
按照效率排序的话,count(字段)<count(主键id)<count(1) 约等于count(* ),所以尽量使用count(*)
7、update优化
InnoDB的行锁是针对索引加的锁,不是针对记录加的锁,并且该索引不能失效,否则会从行锁升级为表锁
因此update的时候条件尽量使用索引字段,否则行锁升级为表锁,并发性能就降低
四、视图
1、介绍
视图是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且在使用视图时动态生成的。
通俗的将,视图只保存了查询的SQL逻辑,不保存查询结果,所以我们在创建视图的时候,主要工作就落在创建这条SQL查询语句上
2、增删改查语法
-
创建
create [or replace] view 视图名称 as select语句 [with[cascaded|local]check option]
-
查询
查看创建视图语句 show create view 视图名称 查看视图数据 select * from 视图名称 ---跟查询表数据一样
-
修改
方式一:create or replace view 视图名称 as select语句[with[cascaded |local]check option] 方式二:alter view 视图名称 as select语句[with[cascaded |local]check option]
-
删除
drop view [if exists] 视图名称
3、视图的检查选项
当使用with check option字句创建视图时,MySQL会通过视图检查正在更改的每个行,例如插入、更新、删除,以及其符号视图的定义。MySQL允许基于另一个视图创建视图,它会检查依赖视图中的规则以保持一致性。为了确定检查的范围,mysql提供了两个选项:cascaded和local,默认值为cascaded
cascaded:进行级联查询 如果当前视图有检查,即使它依赖的视图没有检查,也要进行检查
local:进行递归查询 如果有检查才会进行判断
4、视图更新的条件
要使视图可更新,视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含一下任意一项,则该视图不可个更新。
-
聚合函数或窗口函数 (sum、min、max、count等)
-
distinct
-
group by
-
having
-
union或者union all
5、作用
-
简单:视图不仅可以简化用户对数据的理解,也可以简化他们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件。
-
安全:数据库可以授权,但不能授权到数据库特定的行和特定的列上。通过视图用户只能查询和修改他们所见到的数据
-
数据独立:视图可帮助用户屏蔽真实表结构变化带来的影响。
6、案例
类似这种应用都可以使用到视图
五、存储过程
1、介绍
存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。
存储过程思想上很简答,就是数据库SQL语言层面的代码封装与重用。
2、特点
封装,复用
可以接收参数,也可以返回数据
减少网络交互,效率提高
3、语法
创建:
create procedure 存储过程名称([参数列表]) begin ---一条或者多条SQL语句 end;
调用
call 名称([参数])
查看
select * from information_schema.routines where routine_schema = '数据库名' ;查询指定数据库的存储过程及状态信息 show create procedure 存储过程名称;
删除
drop procedure [if exists] 存储过程名称;
注意:在命令行中,执行创建存储过程的SQL时,需要通过关键字delimiter指定SQL语句的结束符
4、变量
4.1 系统变量
系统变量是MySQL服务器提供,不是用户定义的,属于服务器层面。分为全局变量(GLOBAL)、会话变量(SESSION)
查看系统变量
show [session | global] variables; --查看所有系统变量 show [session | global] variables like '...' --可以通过like模糊匹配方式查找变量 select @@[session |global] 系统变量名; --查看指定变量的值
设置系统变量
set [session | global] 系统变量名 = 值; set @@[session | global]系统变量名 = 值;
注意:
如果没有指定session/global,默认是session,会话变量
mysql服务重新启动之后,所设置的全局参数会失效,要想不失效,可以在/etc/my.cnf中配置
@@代表系统变量 @代表用户自定义变量
4.2 用户变量
用户定义变量是用户根据需要自己定义的变量,用户变量不用提前声明,在用的时候直接用@变量名使用即可。其作用域为当前连接
-
赋值
set @var_name = 'ww' set @var_age := 11 select @var_gender := '女' select 字段名 info @var_name from 表名
-
使用
select @var_name;
注意:用户定义的变量无序对其进行声明或初始化,只不过获取到的值为null
4.3 局部变量
局部变量是根据需要定义在局部生效的变量,访问之前,需要declare声明。可用做存储过程内的局部变量和输入参数,局部变量的范围是在其内声明的begin end块
-
声明
declare 变量名 变量类型
变量类型就是数据库字段类型:int、tinyint、bigint、char、date等
-
赋值
set 变量名 = 值; set 变量名 := 值; select 字段名 into 变量名 from 表名;
5、流程控制
5.1 if
语法:
if 条件1 then elseif 条件2 then else end if;
举例:
create procedure p1() begin declare score int default 58; declare grade varchar(10); if score >= 85 then set grade := '优秀'; elseif score >= 60 then set grade := '及格'; else set grade := '不及格'; end if; select grade; end; call p1();
5.2 参数
类型 | 含义 | 备注 |
---|---|---|
in | 该类参数作为输入,也就是需要调用时传入值 | 默认 |
out | 该类参数作为输出,也就是该参数可以作为返回值 | |
inout | 既可以作为输入参数,也可以作为输出参数 |
用法:
create procedure 存储过程名称([in/out/inout 参数名 参数类型]) begin -SQL语句 end;
举例:
create procedure p2(in score int ,out grade varchar(10)) begin if score >= 85 then set grade := '优秀'; elseif score >= 60 then set grade := '及格'; else set grade := '不及格'; end if; end; call p2(78,@grade); select @grade;
5.3 case
实例:
5.4 while
while循环是有条件的循环控制语句。满足条件弧,再执行循环体中的SQL语句。具体语法为:
# 先判断条件,如果条件为true,则执行逻辑,否则,不执行逻辑 while 条件 do SQL逻辑 end while;
举例:
create procedure p3(in n int) begin declare num int default 0; while n > 0 do set num := num + n; set n := n - 1; end while; select num; end;
5.5 repeat
5.6 loop
举例:
从1到n的累加
5.7 游标
游标是用来莻查询结果集的数据类型。在存储过程和函数中可以使用游标对结果集进行循环的处理。游标的使用包括游标的声明、open、fetch和close,其语法分别如下:
声明游标
declare 游标名称 cursor for 查询语句;
打开游标
open 游标名称;
获取游标记录
fetch 游标名称 into 变量
关闭游标
close 游标名称
5.8 条件处理程序
举例:
create procedure p4(in uage int) begin declare uname varchar(100); declare upro varchar(100); declare u_cursor cursor for select name,profession from tb_user where age <= uage; declare exit handler for SQLSTATE '02000' close u_cursor; drop table if exists tb_user_pro; create table if not exists tb_user_pro ( id int primary key auto_increment, name varchar(100) not null , profession varchar(100) not null ); open u_cursor; while true do fetch u_cursor into uname,upro; insert into tb_user_pro values (null,uname,upro); end while; close u_cursor; end;
六、存储函数
存储函数是有返回值的存储过程,存储函数的只能是in类型的
create function 存储函数名称([参数列表]) returns 返回值类型 [characterisic..] begin --sql语句 return ... end; characteristic说明: deterministic:相同的输入参数总是产生相同的结果 no sql:不包含sql语句 reads sql date:包含读取数据的语句,但不包含写入数据的语句
select fun1(10);
不常用,存储函数都能用存储过程替代
七、触发器
7.1 概念
触发器是与表有关的数据库对象,指在insert/update/delete之前或之后,触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性,日志记录,数据校验等操作。
使用别名old和new来引用触发器中发生变化的记录内容,这与其他数据库是相似的。现在触发器还只支持行级触发,不支持语句级触发。
行级触发:语句影响了几行就触发几次
语句触发:一个语句不管影响几行,也触发一次
7.2 语法
创建:
create trigger trigger_name before/after insert/update/delete on 表名 for each row begin 触发后要干的逻辑 end;
查看
show triggers;
删除
drop trigger [数据库名].trigger_name -- 如果没有指定数据库名,默认为当前数据库
实例:
-- 创建数据库test create database test; use test; -- 创建表test_log create table test_log ( id int primary key auto_increment, dml_type varchar(100) , test varchar(200) ); -- 创建表test_user create table test_user ( id int primary key auto_increment, name varchar(100) , age int ); -- 创建触发器trigger_na 当test_user出现插入之后 执行begin-end之间的逻辑 create trigger trigger_na after insert on test_user for each row begin insert test_log values (null,'insert',concat('id =',new.id,',name =',new.name)); end; insert into test_user (id, name, age) values (null,'lisi',11); -- 查看 show triggers ; -- 删除 drop trigger test.trigger_na;
八、锁
8.1 概念
锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中除传统的计算资源(cpu、ram、I/O)的争用以外,数据也是一个供多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤为重要,也更加复杂。
8.2 分类
MySQL中的锁,按照锁的粒度分,分为以下三类:
-
全局锁:锁定数据库中的所有表
-
表级锁:每次操作锁住整张表
-
行级锁:每次操作锁住对应的行数据
8.3 全局锁
全局锁就是对整个数据库实现加锁,加锁后整个实例就处于只读状态,后续的DML的写语句,DDL语句,已经更新操作的事务提交语句都将被阻塞。
其典型的使用场景是做全库的逻辑备份,对所有表进行锁定,从而获取一致性视图,保证数据的完整性。
不加锁情况:
加锁后情况:
直接在windows中连接虚拟机数据库 然后将进行备份
-h虚拟机地址 -P端口 -u用户名 -p密码 test是数据库名称(准备备份的数据吗) 后面的是备份地址
特点:
数据库中加全局锁,是一个比较重的操作,存在一下问题:
-
如果在主库上备份,那么备份期间都不能执行更新,业务基本上停摆
-
如果在从库上备份,那么在备份期间从库不能执行主库同步过来的二进制日志(binlog),会导致主从延迟。
在InnoDB引擎中,我们可以在备份时加上参数 --single-transaction参数来完成不加锁的一致性数据备份。
mysqldump --single-transaction -uroot -p123456 test > d:/testcopy.sql
8.4 表级锁
表级锁,每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MyISAM、InnoDB等存储引擎汇总。
对于表级锁,主要分为以下三类:
-
表锁
-
元数据锁(meta data lock,MDL)
-
意向锁
1、表锁
对于表锁,分为两类:
表共享读锁(read lock) --- SHARED_READ_ONLY
表独占写锁(write lock) --- SHARED_NO_READ_WRITE
语法:
加锁:lock tables 表名 read/write
释放锁:unlock tables 或者客户端断开连接
红色代表不可以,绿色代表可以
读锁不会阻塞其他客户端的读,但是会阻塞写。
写锁既会阻塞其他客户端的读,也会阻塞其他客户端的写
2、元数据锁(meta data lock ,MDL)
MDL加锁过程是系统自动控制,无序显示使用,在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据(元数据可以说是表结构)的数据一致性,在表上有活动事务的时候,不可以对元数据进行写入操作。为了避免DML和DDL冲突,保证读写的正确性。
在 MySQL5.5中引入MDL,当对一张表进行增删改查的时候,加入MDL读锁
当对表结构进行变更的时候,加MDL写锁(排他)
查看元数据锁
select object_type,object_schema,object_name,lock_type,lock_duration from performance_schema.metadata_locks;
3、意向锁
为了避免DML在执行时,加的行锁与表锁的冲突,在InnoDB中引入了意向锁,使得表锁不用检查每行数据是否加锁,使用意向锁来减少表锁的检查
分类:
1.意向共享锁(IS):由语句select...lock in share mode添加,与表锁共享锁(read)兼容,与表锁排它锁write互斥
2.意向排他锁(IX):有insert、update、delete、select...for dupate添加,与表锁共享锁(read)及排它锁(write)都互斥。意向锁之间不会互斥。
8.5 行级锁
行级锁,每次操作锁住对应的行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用在InnoDB存储引擎中。
InnoDB的数据是基于索引组织的,行锁是通过对索引上的索引项加锁来实现的,而不是对记录加的锁。对于行级锁,主要分为以下三类:
-
行锁(Record Lock):锁定单个记录的锁,防止其他事务对此进行update和delete。在Read committed、Repeatable Read隔离级别下都支持
-
间隙锁(Gap Lock):锁定索引记录间隙(不含该记录),确保索引记录间隙不变,防止其他事务在这个间隙进行insert,产生幻读。在Repeatable Read隔离级别下都支持。
-
临键锁(Next-key Lock):行锁和间隙锁组合,同时锁住数据,并锁住数据前面的间隔Gap。在RR隔离级别下支持
1、行锁
InnoDB实现了一下两种类型的行锁:
-
共享锁(S):允许一个事务去读一行,阻止其他事务获取相同数据集的排它锁
-
排他锁(X):允许获取排他锁的事务更新数据,阻止其他事务获得相同数据集的共享锁和排他锁。
查看意向锁和行级锁
select object_schema,object_name,index_name,lock_type,lock_mode,lock_data from performance_schema.data_locks;
默认情况下,InnoDB在 Repeatable read事务隔离级别运行,InnoDB使用next-key 临键锁 进行搜索和索引扫描,以防止幻读。
-
针对唯一索引进行检索(updatedelete)时,对已存在的记录进行等值匹配时,将会自动优化为行锁
-
InnoDb的行锁是针对索引加的锁,不通过索引条件检索数据,那么InnoDb将对表中所有数据加锁,此时就相当于表锁了
2、间隙锁/临键锁
默认情况下,InnoDB在Repeatable Read事务隔离级别下运行,InnoDB使用next-key锁进行搜索和索引扫描,以防止幻读。
-
索引上的等值查询(唯一索引),给不存在的记录加锁时,优化为间隙锁。
-
索引上的等值查询(普通索引),向右遍历时最后一个值不满足查询需求。
-
索引上的范围查询(唯一索引),会访问到不满足条件的第一个值为止。
注意:间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存,一个事务采用的间隙锁,不会组织另一个事务在同一间隙上采用间隙锁
九、InnoDB引擎
1、逻辑结构
2、架构
MySQL5.5版本开始,默认使用InnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。下面是InnoDB架构图,左侧为内存结构,右侧为磁盘结构
2.1 内存结构
Buffer pool:缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据(若缓冲池没有数据,则从磁盘加载并缓存),然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快处理速度。
缓冲池以Page页为单位,底层采用链表数据结构管理Page。根据状态,将Page分为三种类型:
-
free page:空闲page,未被使用。
-
clean page:被使用page,数据没有被修改过。
-
dirty page:脏页,被使用page,数据被修改过,数据与磁盘的数据产生了不一致
Change Buffer:更改缓冲区(针对于非唯一二级索引页),在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会会直接操作磁盘,而会将数据变更在更新缓存区Change Buffer中,在未来数据被读取时,在将数据合并恢复到Buffer Pool中,再将合并后的数据刷新到磁盘中。
Change Buffer的意义是什么?
与聚集索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引。同样,删除和更新可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO。有了Change Buffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO
Adaptive Hash Index:自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控表上各索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。
自适应哈希索引,无序人工干预,是系统根据情况自动完成
参数:adaptive_hash_index
show variables like '%adaptive_hash_index%';
Log Buffer:日志缓冲区,用来保存要写入到磁盘中的log日志数据(redo log、undo log),默认大小为16MB,日志缓冲区的日志会定期刷新到磁盘汇总。如果需要更新、插入或删除许多行的事务,增加日志缓冲区的大小可以节省磁盘I/O
参数:
innodb_log_buffer_size:缓冲区大小
innodb_flush_log_at_trx_commit:日志刷新到磁盘时机
-
1:日志在每次事务提交时写入并刷新到磁盘
-
0:每秒将日志写入并刷新到磁盘一次
-
2:日志在每次事务提交后写入,并每秒刷新到磁盘一次
show variables like '%innodb_log_buffer_size' show variables like '%innodb_flush_log_at_trx_commit'
2.2 磁盘结构
System Tablespace:系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建的,它也可能包含表和索引数据(在MySQL5.X版本中还包含InnoDB数据字典、undolog等)
参数:innodb_data_file_path
show variables like '%innodb_data_file_path'
File-Per-Table Tablespaces:每个表的文件表空间包含单个InnoDb表的数据和索引,并存储在文件系统上的的那个数据文件中。 .ibd文件
参数:innodb_file_par_table
show variables like '%innodb_file_per_table'
General Tablespaces:通用表空间,需要通过create tbalespace 语法创建通用表空间,在创建表的时候,可以指定该表空间
create tablespace ts_test add datafile 'wintertest.ibd' engine = innodn; create table a ( id int primary key auto_increment, name varchar(20) not null ) engine = innodb tablespace ts_test;
Undo Tablespaces:撤销表空间,MySQL实例在初始化时会自动创建两个默认undo表空间(初始大小16M),用于存储undo log 日志 undo_001, undo_002
Temporary Tablespaces:InnoDB使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据
Doublewrite Buffer Files:双写缓冲区,innoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中,便于系统异常时恢复数据。
#ib_16384_0.dblwr,#ib_16384_1.dblwr
Redo Log:重做日志,是用来实现事务的持久性。该日志文件由两部分组成:重写缓冲(redo log buffer)以及重做日志文件(redo log),前者是在内存中,后者在磁盘中。当时事务提交之后会把所有修改信息都会存到该日志中,用于刷新脏页到磁盘时,发生错误时,进行数据恢复使用。
以循环方式重写日志文件,涉及两个文件:ib_logfile0 , ib_logfile1
2.3 后台线程
-
Master Thread
核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性,还包括脏页的刷新、合并插入缓存、undo页的回收
-
IO Thread
在InnoDB存储引擎中大量使用AIO来处理IO请求,这样可以极大地提高数据库的性能,而IO Thread主要负责这些IO请求的回调。
线程类型 默认个数 职责 Read thread 4 负责读操作 Write thread 4 负责写操作 Log thread 1 负责将日志缓冲区刷新到磁盘 Insert buffer thread 1 负责将写缓冲区内容刷新到磁盘 -
Purge Thread
主要用于回收事务已经提交的undo log ,在事务提交之后,undo log可能不用了,就用它来回收
-
Page Cleaner Thread
协助Master Thread 刷新脏页到磁盘的线程,它可以减轻Master Thread的工作压力,减少阻塞
3、事务原理
事务: 事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。
特性:
-
原子性(Atomicity):事务是不可分割的最小操作单元,要么全部成功,要么全部失败。
-
一致性(Consistency):事务完成时必须使所有的数据都保持一致状态。
-
隔离性(Isolation):数据库系统提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
-
持久性(Durability):事务一旦提交或回滚,它对数据库中的数据的改变就是永久的。
3.1 redo log
重做日志,记录的是事务提交时数据页的物理修改,是用来里实现事务的持久性。
该日志文件由两部分组成:重做日志缓冲(redo log buffer)及重做日志文件(redo log file),前者是在内存中,后者是在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于刷新脏页到磁盘,发生错误时,进行数据恢复使用。
3.2 undo log
回滚日志,用于记录数据被修改前的信息,作用包含两个:提供回滚和MVCC(多版本并发控制)
undo log和redo log 记录物理日志不一样,它是逻辑日志,可以认为当delete一条记录时,undo log 中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rollback时,乐园从undo log中的逻辑记录读取到响应的内容并进行回滚。
undo log 销毁:undo log 在事务执行时产生,事务提交时,并不会立即删除undo log ,因为这些日志可能还用于MVCC
undo log 存储:undo log 采用段的方式进行管理和记录,存放在前面介绍的rollback segment回滚段中,内部包含1024个undo log segment
4、MVCC
4.1 基本概念
-
当前读
读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:select ... lock in share mode(共享锁),select ... for update 、update、insert、delete(排他锁)都是一种当前读
-
快照读
简单的select(不加锁)就是快照读,快照读读到的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。
-
Read Committed:每次select,都生产一个快照读
-
Repatable Read:开启事务后第一个select语句才是快照读的地方。
-
Serializable:快照读会退化为当前读。
-
-
MVCC
全称Multo-Version Concurrentcy Control,多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现,还需要依赖与数据记录中的是哪个隐式字段、undo log日志、readView
4.2 MVCC实现原理
-
隐藏字段
隐藏字段 | 含义 |
---|---|
DB_TRX_ID | 最近修改事务ID,记录插入这条记录或最后一次修改该记录的事务ID |
DB_ROLL_PTR | 回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本 |
DB_ROW_ID | 隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段 |
如果有主键就没有该字段DB_ROW_ID
-
undo log
回滚日志在,在insert、update、delete的时候产生的便于数据回滚的日志。
当insert的时候,产生的undo log 日志只在回滚时需要,在事务提交后,可被立即删除
而update、delete的时候,产生的undo log 日志不仅在回滚时需要,在快照时也需要,不会立即被删除
-
undo log版本链
不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表的尾部是最早的旧记录
-
ReadView
ReadView(读视图)是快照读SQL执行时MVCC提供数据的依据,记录并维护系统当前活跃的事务id
字段 含义 m_ids 当前活跃的事务ID记录 (未提交的事务) min_trx_id 最小活跃事务ID max_trx_id 预分配事务ID,当前最大事务ID+1(因为事务ID是自增的) creator_trx_id ReadView创建者的事务ID
不同的隔离级别,生成ReadView时机不同:
Read COMMITTED:在事务中每一次执行快照时生成ReadView
Repeatable READ:仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView
-
实例:
十、MySQL管理
1、系统数据库
Mysql数据库按照完成后,自带四个数据库
2、常用工具
db01是数据库名称