注:本篇笔记根据黑马程序员 MySQL数据库入门到精通的进阶篇章所创建,适合复习和结合该视频学习使用。书接上文MySQL基础篇的笔记,没有看过的建议先看完再来看这个。
1.存储引擎
体系结构
-
连接层
最上层是一些客户端和链接服务,主要完成一些类似于连接处理、授权认证、及相关的安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
-
服务层
第二层架构主要完成大多数的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化,部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如 过程、函数等。
-
引擎层
存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能,这样我们可以根据自己的需要,来选取合适的存储引擎。
-
存储层
主要是将数据存储在文件系统之上,并完成与存储引擎的交互
存储引擎简介
概述:存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式 。存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。
在创建表时,指定存储引擎。若不指定,默认为INNODB
CREATE TABLE 表名(
字段1 字段1类型 [COMMENT 字段1注释]
......
字段n 字段n类型 [COMMENT 字段n注释]
)NE=INNODB[COMMENT 注释]
查看当前数据库支持的存储引擎
SHOW ENGINES;
存储引擎特点
-
InnoDB
-介绍
- InnoDB是一种兼顾高可靠性和高性能的通用存储引擎,在 MySQL5.5之后,InnoDB是默认的 MySQL 存储引擎。
-特点
- DML操作遵循ACID模型,支持事务;
- 行级锁,提高并发访问性能;
- 支持外键 FOREIGN KEY约束,保证数据的完整性和正确性;
-文件
- xxx.ibd:xxx代表的是表名,innoD8引擎的每张表都会对应这样一个表空间文件,存储该表的表结构(frm、sdi)、数据和索引。参数:innodb_file_per_table,表示每张表有一个表空间。
-逻辑存储结构
- innoDB逻辑上可分为表空间、段、区、页。
-
MyISAM
-介绍- MyISAM是MySQL早期的默认存储引擎。
-特点
- 不支持事务,不支持外键
- 支持表锁,不支持行锁
- 访问速度快
文件
- xxx.sdi:存储表结构信息
- xxx.MYD:存储数据
- xxx.MYI:存储索引
-
Memory
-介绍- Memory引擎的表数据时存储在内存中的,由于受到硬件问题、或断电问题的影响,只能将这些表作为临时表或缓存使用。
-特点
- 内存存放,速度快
- hash索引(默认)
-文件
- xxx.sdi:存储表结构信息
存储引擎的选择
三者比较
特点 | InnoDB | MyISAM | Memory |
---|---|---|---|
存储限制 | 64TB | 有 | 有 |
事务安全 | 支持 | – | – |
锁机制 | 行锁 | 表锁 | 表锁 |
B+tree索引 | 支持 | 支持 | 支持 |
Hash索引 | – | – | 支持 |
全文索引 | 支持(5.6版本之后) | 支持 | – |
空间使用 | 高 | 低 | N/A |
内存使用 | 高 | 低 | 中等 |
批量插入速度 | 低 | 高 | 高 |
支持外键 | 支持 | – | – |
适合的业务场景
注:在选择存储引擎时,应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统,还可以根据实际情况选择多种存储引擎进行组合。
- InnoDB: 是Mysql的默认存储引擎,支持事务、外键。如果应用对事务的完整性有比较高的要求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操作,那么InnoDB存储引擎是比较合适的选择。
- MVISAM: 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
- MEMORY: 将所有数据保存在内存中,访问速度快,通常用于临时表及缓存。MEMORY的缺陷就是对表的大小有限制,太大的表>A无法缓存在内存中,而且无法保障数据的安全性。
2.索引
概述
索引(index)是帮助MySQ高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
优点
- 提高数据检索的效率,降低数据库的I0成本
- 通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗。
缺点
- 索引列也是要占用空间的。
- 索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE时,效率降低。
索引结构
MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的结构,主要包含以下几种:
索引结构 | 描述 |
---|---|
B+Tree索引 | 最常见的索引类型,大部分引擎都支持 B+ 树索引 |
Hash索引 | 底层数据结构是用哈希表实现的,只有精确匹配索引列的查询才有效,不支持范围查询 |
R-tree(空间索引) | 空间索引是MVISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少 |
Full-text(全文索引) | 是一种通过建立倒排索引,快速匹配文档的方式。类似于Lucene,Solr,ES |
对各个引擎的支持情况
索引 | InnoDB | MyISAM | Memory |
---|---|---|---|
B+Tree索引 | 支持 | 支持 | 支持 |
Hash索引 | 不支持 | 不支持 | 支持 |
R-tree索引 | 不支持 | 支持 | 不支持 |
Full-text索引 | 5.6版本后支持 | 支持 | 不支持 |
注:
-
我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。
-
MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,又增加了一个指向相邻叶子节点的链表指针,就形成了带有顺序循环指针的B+Tree,提高区间访问的性能。
-
在MySQL中,支持hash索引的是Memory引擎,而innoD8中具有自适应hash功能,hash索引是存储引擎根据B+Tree索引在指定条件下自动构
建的。 -
相对于二叉树,层级更少,搜索效率高。相对于B-tree,无论是叶子节点还是非叶子节点,都会保存数据,这样导致一页中存储的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低。
-
相对Hash索引,B+tree支持范围匹配及排序操作。
索引分类
分类 | 含义 | 特点 | 关键字 |
---|---|---|---|
主键索引 | 针对于表中主键创建的索引 | 默认自动创建,只能有一个 | PRIMARY |
唯一索引 | 避免同一个表中某数据列中的值重复 | 可以有多个 | UNIQUE |
常规索引 | 快速定位特定数据 | 可以有多个 | |
全文索引 | 全文索引查找的是文本中的关键词,而不是比较索引中的值 | 可以有多个 | FULLTEXT |
在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种:
分类 | 含义 | 特点 |
---|---|---|
聚集索引(Clustered Index) | 将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据 | 必须有,而且只有一个 |
二级索引(Secondary Index) | 将数据与索引分开存储,索引结构的叶子节点关联的是对应的主键 | 可以存在多个 |
聚集索引选取规则:
- 如果存在主键,主键索引就是聚集索引。
- 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
- 如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引。
回表查询
先根据二级索引去查找对应的关键字,得到对应的主键。再根据聚集索引得到该主键对应的行数据。
所以直接根据主键查询更快。
索引语法
-
创建索引
CREATE [UNIQUE|FULLTEXT] INDEX index_name ON table_name ( index_col_name,...);
- [ ]中的内容不选默认为常规索引
- 字段只写一个为单列索引,多个则为联合索引
-
查看索引
SHOW INDEX FROM table_name;
-
删除索引
DROP INDEX index_name ON table_name;
注:索引名称一般为: idx_表名_字段名
SQL性能分析
SOL执行频率
MySQL客户端连接成功后,通过show [session l global] status
命令可以提供服务器状态信息。通过如下指令,可以查看当前数据库的INSERT、UPDATE、DELETE、SELECT的访问频次:
SHOW GLOBAL STATUS LIKE 'Com_______';
注:七个 _
慢查询日志
慢查询日志记录了所有执行时间超过指定参数(long_query_time
,单位:秒,默认10秒)的所有SQL语句的日志。MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)
中配置如下信息:
- 开启MySOL慢日志查询开关
slow query_l0g=1
- 设置慢日志的时间为2秒,SOL语句执行时间超过2秒,就会视为慢查询,记录慢查询日志
long query time=2
配置完毕之后,通过以下指令重新启动MySQL服务器进行测试,查看慢日志文件中记录的信息 /var/lib/mysql/localhost-slow.log
。
profile详情
show profiles
能够在做SOL优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling
参数,能够看到当前MySQL是否支持profile
操作:
SELECT @@have_profiling ;
默认profiling是关闭的,可以通过set语句在session/global级别开启profiling:
SET profiling=1;
然后可以通过如下指令查看指令的执行耗时:
-
查看每一条SOL的耗时基本情况(会显示
query_id
)show profiles;
-
查看指定
query_id
的SQL语句各个阶段的耗时情况show profile for query query_id;
-
查看指定
query_id
的SQL语句CPU的使用情况show profile cpu for query query_id;
explain执行计划
EXPLAIN
或者 DESC
命令获取 MVSOL如何执行 SELECT 语句的信息,包括在 SELECT 语句执行过程中表如何连接和连接的顺序,语法:
#直接在select语句之前加上关键字 explain或desc
EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件
查询到的各个字段含义
字段 | 含义 |
---|---|
id | select查询的序列号,表示查询中执行select子语句或者是操作表的顺序(多表联查,若id相同,执行顺序从上到下;id不同,值越大,越先执行)。 |
select_type | 表示 SELECT的类型,常见的取值有 SIMPLE(简单表,即不使用表连接或者子查询)、PRIMARY(主查询,即外层的查询) 、UNION(UNION中的第二个或者后面的查询语句)、SUBQUERY(SELECT/WHERE之后包含了子查询)等 |
type | 表示连接类型,性能由好到差的连接类型为NULL(不访问表)、system、const(使用主键或唯一索引)、eq_ref、ref(使用非唯一索引)、range、index(遍历整个索引)、all(全表扫描)。 |
possible_key | 显示可能应用在这张表上的索引,一个或多个 |
Key | 实际使用的索引,如果为NULL,则没有使用索引 |
Key_len | 表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好 |
rows | MySQL认为必须要执行查询的行数,在innodb引擎的表中,是一个估计值,可能并不总是准确的 |
filtered | 表示返回结果的行数占需读取行数的百分比,filtered 的值越大越好 |
Extra | 额外的信息 |
索引的使用规则
最左前缀法则
联合索引中,要遵守最左前缀法则。最左前缀法则指的是查询必须从索引的最左列开始,并且不跳过索引中的列。如果跳跃某一列,索引将部分失效(该索引不失效,后面的字段索引失效)。
该顺序为创建联合索引时所指定的顺序,查询时字段的书写顺序并不影响,即必须有第一个索引,且不能跳过中间的某些字段。
范围查询
联合索引中,出现范围查询(即 >,<),范围查询(不包括)右侧的列索引失效。为了避免这种情况,应该使用 >=, <=。
索引列运算
不要在索引列上进行运算操作,否则索引将失效。
字符串不加引号
字符串类型字段使用时,不加引号,索引将失效。
模糊查询
如果仅仅是针对尾部模糊匹配,索引不会失效。如果是针对头部模糊匹配,索引失效,变成全表扫描。所以在大数据查询下,应该规避头部模糊查询。
or连接的条件
用or分割开的条件,如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
数据分布影响
如果MySQL评估使用索引比全表更慢,则不使用索引。
SQL提示
SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
-
use index(建议用某个索引)
explain select * from 表名 use index(索引名) where ...
-
ignore index(不用某个索引)
explain select * from 表名 ignore index(索引名) where ...
-
force index (强制用某个索引)
explain select * from 表名 force index(索引名) where ...
覆盖索引
尽量使用覆盖索引(查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到),即,不会进行回表查询。
比如根据name查询name和id,首先会根据二级索引找到对应的name,由于二级索引的叶子节点挂的是要查询的主键id,所以此时不用回表查询。
usingindex condition : 查找使用了索引,但是需要回表查询数据
using where; usingindex : 查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据
栗子:
一张表,有四个字段(id,username,password,status)由于数据量大,需要对以下SQL语句进行优化,该如何进行才是最优方案:
select id,username,password from tb user where username = 'jack';
优化方案:建立username和password 的联合索引。
前缀索引
当字段类型为字符串(varchar,text等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘!0,影响查询效率。此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。
前缀索引只会匹配前缀,找到相同前缀后再回表查询,进行全文比对,不相同再去查找碰撞列表的下一个进行回表查询。
语法
create index idx_xxx on table_name(column(n));
前缀长度
可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高。唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。
可以通过查询所选取的前缀长度中互不相同的占总记录数的百分比。比如:
select count(distinct substring(email,1,5))/ count(*) from tb_ user;
单列索引与联合索引
在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引,而非单列索引。
索引的设计原则
- 针对于__数据量较大(百万以上),且查询比较频繁__的表建立索引。
- 针对于常作为查询条件(where)、排序(orderby)、分组(groupby)操作的字段建立索引。
- 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。
- 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引。
- 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间,避免回表,提高查询效率。
- 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率。
- 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询。
3.SQL优化
插入数据
-
insert优化
-
尽量批量插入(500~1000)
-
手动提交事务
start transaction; .... commit;
-
尽量主键顺序插入
-
-
大批量插入数据
如果一次性需要插入大批量数据,使用insert语句插入性能较低,此时可以使用MVSOL数据库提供的load指令进行插入,且最好主键顺序插入。
-
客户端连接服务端时,加上参数 --local-infile,表示从本地加载数据
mysql --local-infile -u root -p
-
设置全局参数local_infile为1,开启从本地加载文件导入数据的开关
set global local infile=1;
-
执行load指令将准备好的数据,加载到表结构中,并且规定字段间用‘,’分隔,每行数据间用换行分隔。
load data local infile '/root/sal1.log' into table 'tb user` fields terminated by ',' lines terminated by '\n';
-
主键优化
-
数据组织方式
在InnoDB存储引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表(index oraanized table lOT)
-
页分裂
页可以为空,也可以填充一半,也可以填充100%。每个页包含了2到N行数据(如果一行数据多大,会行溢出;如果只有一行数据则退化为链表),根据主键递增排列。
当主键乱序插入时,要插入的位置对应的页若满了,则会单独开辟一个页,并将原本要插入的页尾部的内容移到新页上,然后再进行插入,最后再调整页指针的指向,使其满足主键以此递增。这种现象就叫做页分裂。
-
页合并
当删除一行记录时,实际上记录并没有被物理删除,只是记录被标记(flaged)为删除,并且它的空间变得允许被其他记录声明使用。当页中删除的记录达到 MERGE THRESHOLD(默认为页的50%),InnoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用。这种现象叫做页合并。
-
主键设计原则
- 满足业务需求的情况下,尽量降低主键的长度。
- 插入数据时,尽量选择顺序插入,选择使用AUTOINCREMENT自增主键
- 尽量不要使用UUID(随机产生的)做主键或者是其他自然主键,如身份证号,太长且不递增。
- 业务操作时,尽量避免对主键的修改。
order by优化
-
Using filesort
通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sortbuffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。
-
Using index
通过有序索引顺序扫描直接返回有序数据,这种情况即为using index,不需要额外排序,操作效率高。
-
优化方案
- 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。
- 尽量使用覆盖索引。
- 多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASC/DESC,按照排序规则创建)。
- 如果不可避免的出现fileson,大数据量排序时,可以适当增大排序缓冲区大小son buffer size(默认256K)。若排序的数据量超过了缓冲区大小,则会在磁盘进行排序,效率低。
group by优化
- 在分组操作时,可以通过索引来提高效率。
- 分组操作时,索引的使用也是满足最左前缀法则的。
limit优化
一个常见又非常头疼的问题就是 limit 在进行大数据的分页查询,且查询数据靠后时,比如 limit 2000000,10;
,此时需要MVSOL排序前2000010记录,仅仅返回2000000-2000010的记录,其他记录丢弃,查询排序的代价非常大。
优化思路:
一般分页查询时,通过创建 覆盖索引 能够比较好地提高性能,可以通过覆盖索引加子查询(先通过覆盖索引拿到递增主键,再通过主键去查询数据)形式进行优化。
count优化
-
MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count()的时候会直接返回这个数,效率很高
-
InnoDB 引擎就麻烦了,它执行 count(*)的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。
优化思路: 自己计数。即维护表的数据量,增删数据的同时所记录的总数也随之改变
count的几种用法
- count(主键)
InnoDB 引擎会遍历整张表,把每一行的 主键id 值都取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为nul)。 - count(字段)
- 没有notnul 约束:nnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,服务层判断是否为nul,不为nul,计数累加
- 有not null约束:InnoD8 引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,直接按行进行累加
- count(1)
InnoD8 引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字“1”进去,直接按行进行累加 - count(*)
InnoDB引擎并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加。
按照效率排序的话,count(字段)<count(主键 id)<count(1)≈count(*),所以尽量使用 count(*)
update优化
InnoDB的行锁是针对索引加的锁,不是针对记录加的锁,并且该索引不能失效,否则会从行锁升级为表锁。故 尽量根据主键/索引字段进行数据更新。
如在对某一没有索引的字段进行update时,就会由行锁升级为表锁,使得其他事务无法对该表进行操作,降低了并发性。
4.视图/存储过程/触发器
视图
概述
视图(View)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。
通俗的讲,视图只保存了查询的SQL逻辑,不保存查询结果。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上,
语法
创建
CREATE [OR REPLACE] VIEW 视图名称(列名列表) AS SELECT语句 [WITH [CASCADED|LOCAL] CHECK OPTION];
查看创建视图语句
SHOW CREATE VIEW 视图名称;
查看视图数据
SELECT * FROM 视图名称...;
修改
#方式一
CREATE OR REPLACE VIEW 视图名称(列名列表) AS SELECT语句;
#方式二
ALTER VIEW 视图名称[(列名列表)] AS SELECT语句 [WITH[CASCADED|LOCAL] CHECK OPTION];
增加
insert into 视图名称 values(...,...);
删除
DROP VIEW [IF EXISTS] 视图名称 [,视图名称]...;
视图的检查选项
当使用WITH CHECK OPTION
子句创建视图时,MVSOL会通过视图检查正在更改的每个行,例如 插入,更新,删除,以使其符合视图的定义。
MySQL允许基于另一个视图创建视图,它还会检查依赖视图中的规则以保持一致性。为了确定检查的范围,mysql提供了两个选项:CASCADED 和 LOCAL。
- 默认值为CASCADED(级连)。 此时不仅会检查当前视图,还会去检查它所依赖的视图。
- LOCAL,也会去检查他所依赖的视图,不过只有该视图添加了检查选项才会去检查。
视图的更新
要使视图可更新,视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含以下任何一项,则该视图不可更新
- 聚合函数或窗口函数(SUM()、MIN()、MAX()、COUNT()等)
- DISTINCT
- GROUP BY
- HAVING
- UNION 或者 UNION ALL
作用
- 简单
视图不仅可以简化用户对数据的理解,也可以简化他们的操作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的操作每次指定全部的条件。 - 安全
数据库可以授权,但不能授权到数据库特定行和特定的列上。通过视图用户只能查询和修改他们所能见到的数据。 - 数据独立
视图可帮助用户屏蔽真实表结构变化带来的影响。
存储过程
介绍
存储过程是事先经过编译并存储在数据库中的一段 SOL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据处理的效率是有好处的。
存储过程思想上很简单,就是数据库 SOL语言层面的代码封装与重用。
特点
- 封装,复用
- 可以接收参数,也可以返回数据
- 减少网络交互,效率提升
语法
创建
CREATE PROCEDURE存储过程名称([ 参数列表])
BEGIN
SQL语句
END ;
调用
CALL 名称([参数]);
查看
--查询指定数据库的存储过程及状态信息(在系统表INFORMATION_SCHEMA.ROUTINES中)
SELECT * FROM INFORMATION_SCHEMA.ROUTINES WHERE
ROUTINE_SCHEMA='要查询的数据库名 ';
--查询某个存储过程的定义
SHOW CREATE PROCEDURE [IF EXISTS] 存储过程名称;
删除
DROP PROCEDURE [IF EXISTS] 存储过程名称;
注意: 在命令行中,默认结束符时分号,在执行创建存储过程的SQL时,需要通过关键字 delimiter
指定SQL语句的结束符。如delimiter $$
,定义完成后按照同样操作将结束符重新改为分号。
变量
系统变量
系统变量是MySQL服务器提供,不是用户定义的,属于服务器层面。分为全局变量(GLOBAL)、会话变量(SESSION)。
查看系统变量
SHOW [SESSION |GLOBAL] VARIABLES ;
可以通过LIKE模糊匹配方式查找变量
SHOW [SESSION |GLOBAL] VARIABLES LIKE '....';
查看指定变量的值
SELECT @@[SESSION|GLOBAL] 系统变量名;
设置系统变量
SET [SESSION|GLOBAL] 系统变量名=值;
SET @@[SESSION|GLOBAL] 系统变量名=值;
注意:
- 如果没有指定SESSION/GLOBAL,默认是SESSION,
- mysql服务重新启动之后,所设置的全局参数会失效,要想不失效,可以在 /etc/my.cnf中配置。
用户自定义变量
用户定义变量 是用户根据需要自己定义的变量,用户变量不用提前声明,在用的时候直接用“@变量名”使用就可以。其作用域为当前连接。
赋值( 推荐用 := 赋值)
set @var_name = expr [, @var_name = expr] ... ;
set @var_name := expr [, @var_name := expr] ... ;
SELECT @var_name := expr [, @var name := expr] ...;
SELECT 字段名 INTO @var_name FROM 表名;
使用
SELECT @var_name ;
注:用户定义的变量无需对其进行声明或初始化,只不过获取到的值为NULL。
局部变量
局部变量 是根据需要定义的在局部生效的变量,访问之前,需要DECLARE声明。可用作存储过程内的局部变量和输入参数,局部变量的范围是在其内声明的BEGIN … END块。
声明
DECLARE 变量名 变量类型 [DEFAULT 默认值];
变量类型就是数据库字段类型:INT、BIGINT、CHAR、VARCHAR、DATE、TIME等。
赋值
SET 变量名=值;
SET 变量名:=值;
SELECT 字段名 INTO 变量名 FROM 表名...;
if条件
语法
IF 条件1 THEN
...
ELSEIF 条件2 THEN
...
ELSE
...
END IF;
参数
类型 | 含义 | 备注 |
---|---|---|
IN | 该类参数作为输入,也就是需要调用时传入值 | 默认 |
OUT | 该类参数作为输出,也就是该参数可以作为返回值 | |
INOUT | 既可以作为输入参数,也可以作为输出参数 |
语法:
CREATE PROCEDURE 存储过程名称([IN/OUT/INQUT 参数名 参数类型 ])
BEGIN
SQL语句
END;
case
语法一
CASE case_value
WHEN when_value1 THEN statement_list1
[WHEN when_value2 THEN statement_list2] ...
[ ELSE statement_list ]
END CASE;
语法二
CASE
WHEN search_conditionl THEN statement_list1
[WHEN search_condition2 THEN statement_list2]...
[ELSE statement_listl
END CASE;
while
语法
WHILE 条件 DO
SQL逻辑...
END WHILE;
repeat
先执行一次逻辑,然后判定逻辑是否满足,如果满足,则退出。如果不满足,则继续下一次循环
REPEAT
SQL逻辑...
UNTIL 条件
END REPEAT;
loop
LOOP 实现简单的循环,如果不在SQL逻辑中增加退出循环的条件,可以用其来实现简单的死征环。LOOP可以配合一下两个语句使用
- LEAVE:配合循环使用,退出循环。
- ITERATE:必须用在循环中,作用是跳过当前循环剩下的语句,直接进入下一次循环。
语法
[begin label:] LOOP
SQL逻辑...
END LOOP [end_label];
LEAVE label;--退出指定标记的循环体
ITERATE label;--直接进入下一次循环
例子
create procedure p9(in n int)
begin
declare total int default 0;
sum:loop
if n<=0 then
Leave sum;
end if;
set total := total + n;setn:=n-1;
end loop sum;
select total;
end;
游标
游标(CURSOR)是用来存储查询结果集的数据类型,在存储过程和函数中可以使用游标对结果集进行循环的处理。游标的使用包括游标A的声明、OPEN、FETCH和 CLOSE,其语法分别如下。
声明游标
DECLARE 游标名称 CURSOR FOR 查询语句;
打开游标
OPEN 游标名称;
获取游标记录
FETCH 游标名称 INTO 变量[,变量 ];
关闭游标
CLOSE 游标名称;
注意:游标的声明应该在普通变量申明之后
条件处理程序
条件处理程序(Handler)可以用来定义在流程控制结构执行过程中遇到问题时相应的处理步骤。具体语法为:
DECLARE handler action HANDLER FOR condition value [, condition value]... statement ;
- handler action
- CONTINUE: 继续执行当前程序EXIT:终止执行当前程序
- condition value
- SOLSTATE sqlstate_value:状态码,如 02000
- SQLWARNING:所有以01开头的SQLSTATE代码的简写
- NOT FOUND:所有以02开头的SOLSTATE代码的简写
- SOLEXCEPTION:所有没有被SQLWARNING或 NOT FOUND捕获的SQLSTATE代码的简写
例子
createprocedure p12(in uage int)
begin
declare uname varchar(100);
declare upro varchar(100);
declare u_cursor cursor for select name,profession from tb_user where age <= uage;
declare exit handler for not found close u_cursor;
drop table if exists tb user pro;
create table if not exists tb_user_pro(
id int primary key auto_increment,
name varchar(100),
profession varchar(100)
);
open ucursor:
while true do
fetch u_cursor into uname,upro;
insert into tb_user_pro values(null,uname, upro);
end while;
close u_cursor;
end;
存储函数
存储函数是有返回值的存储过程,存储函数的参数只能是IN类型的。具体语法如下:
CREATE FUNCTION 存储函数名称([ 参数列表 ])
RETURNS type [characteristic ...]
BEGIN
--SQL语句
RETURN ...;
END ;
characteristic说明:
- DETERMINISTIC:相同的输入参数总是产生相同的结果
- NO SOL:不包含 SOL语句。
- READS SOL DATA:包含读取数据的语句,但不包含写入数据的语句。
例子
create function fun1(n int)
returns int deterministic
begin
declare total int default 0;
while n>0 do
set total := total + n;
set n:=n-1;end while;
return total;
end;
触发器
介绍
触发器是与表有关的数据库对象,指在 insert/update/delete 之前或之后,触发并执行触发器中定义的SOL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性,日志记录,数据校验等操作。
使用别名 OLD 和 NEW 来引用触发器中发生变化的记录内容,这与其他的数据库是相似的。现在触发器还只支持行级触发,不支持语句级触发。
触发器类型 | NEW 和 OLD |
---|---|
INSERT 型触发器 | NEW 表示将要或者已经新增的数据路 |
UPDATE 型触发器 | OLD 表示修改之前的数据,NEW 表示将要或已经修改后的数据 |
DELETE型触发器 | OLD 表示将要或者已经删除的数据 |
语法
创建
CREATE TRIGGER trigger_ame
BEFORE/AFTER INSERT/UPDATE/DELETE
ON tbl_ame FOR EACH ROW --行级触发器
BEGIN
trigger_tmt ;
END;
查看
SHOW TRIGGERS ;
删除
--如果没有指定 schema name,默认为当前数据库
DROP TRIGGER [schema_name.]trigger_name;
例子
--插入触发器
create trigger tb_user_insert_trigger
after insert on tb_user for each row
begin
insert into user logs(id, operation, operate time, operate id, operate_params) VALUES(null,'insert',now(),new.id);
end;
--删除
create trigger tb_user_insert_trigger
after delete on tb_user for each row
begin
insert into user logs(id, operation, operate time, operate id, operate_params) VALUES(null,'insert',now(),old.id);
end;
5.锁
概述
介绍
锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(CPU、RAM、I/0)的争用以外,数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有效性是所有数据库必须解决的一个问题,锁冲突也是影响数据库并发访问性能的一个重要因素。从这个角度来说,锁对数据库而言显得尤其重要,也更加复杂。
MySQL中的锁,按照锁的粒度分,分为以下三类:
- 全局锁: 锁定数据库中的所有表。
- 表级锁: 每次操作锁住整张表。
- 行级锁: 每次操作锁住对应的行数据
全局锁
介绍
全局锁就是对整个数据库实例加锁,加锁后整个实例就处于只读状态,后续的DML的写语句,DDL语句,已经更新操作的事务提交语句都将被阻塞。
其典型的使用场景是做全库的逻辑备份,对所有的表进行锁定,从而获取一致性视图,保证数据的完整性。
流程
#加锁
flush tables with read lock;
#备份
mysqldump -u 用户名 -p 密码 数据库名 > 要存放的文件路径.sql;
#解锁
unlock tables;
特点
数据库中加全局锁,是一个比较重的操作,存在以下问题:
- 如果在主库上备份,那么在备份期间都不能执行更新,业务基本上就得停摆。
- 如果在从库上备份,那么在备份期间从库不能执行主库同步过来的二进制日志(binlog),会导致主从延迟。
在InnoDB引擎中,我们可以在备份时加上参数 --single-transaction
参数来完成不加锁的一致性数据备份。
语法
mysqldump --single-transaction -u 用户名 -p 密码 数据库名 > 要存放的文件路径.sql;
表级锁
介绍
表级锁,每次操作锁住整张表。锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MVISAM、InnoDB、BDB等存储引擎中。
对于表级锁,主要分为以下三类:
- 表锁
- 元数据锁(meta data lock,MDL)
- 意向锁
表锁
对于表锁,分为两类:
- 表共享读锁(read lock),该表不能写操作,但所有客户端都可进行读操作
- 表独占写锁(write lock),某一客户端独占读写操作,其他客户端不能进行读写
加锁
locktables 表名... read/write;
释放锁
unlock tables; --或客户端断开连接
元数据锁
MDL加锁过程是系统自动控制,无需显式使用,在访问一张表的时候会自动加上。
MDL锁主要作用是维护表元数据的数据一致性,在表上有活动事务的时候(即有事务未提交时),不可以对元数据进行写入操作。为了避免DML与DDL冲突,保证读写的正确性。
在MySQL5.5中引入了MDL,当对一张表进行增删改查的时候,加MDL读锁(共享);
当对表结构进行变更操作的时候,加MDL写锁(排他)。
对应SQL | 锁类型 | 说明 |
---|---|---|
lock tables xxx read/write | SHARED_READ_ONLY / SHARED_NO_READ_WRITE | |
select 、 select … lock in share mode | SHARED_READ | 与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥 |
insert 、update、delete、select … for update | SHARED_WRITE | 与SHARED_READ、SHARED_WRITE兼容,与EXCLUSIVE互斥 |
alter table … | EXCLUSIVE | 与其他的MDL都互斥 |
查看元数据锁:
select object_type,object_schema,object_name,lock_type,lock_ duration from performance_schema.metadata_locks;
意向锁
为了避免DML在执行时,加的行锁与表锁的冲突,在InnoDB中引入了意向锁,使得表锁不用检查每行数据是否加锁,使用意向锁来减少表锁的检查。
分类
-
意向共享锁(IS)
-
与表锁共享锁(read)兼容,与表锁及排它锁(write)互斥。
-
由语句
select..lock in share mode
添加。
-
-
意向排他锁(IX)
-
与表锁共享锁(read)及排它锁(write)都互斥。意向锁之间不会互斥。
-
由
insert、update、delete、select ... for update
添加。
-
可以通过以下SOL,查看意向锁及行锁的加锁情况:
select object_schema,object_name,index_name,lock_type,lock_ mode,lock_data from performance_schema.data_locks;
行级锁
介绍
行级锁,每次操作锁住对应的行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用在InnoDB存储引擎中。
InnoDB的数据是基于索引组织的,行锁是通过对索引上的索引项加锁来实现的,而不是对记录加的锁。对于行级锁,主要分为以下三类:
- 行锁(Record Lock):锁定单个行记录的锁,防止其他事务对此行进行update和delete。在RC、RR隔离级别下都支持。
- 间隙锁(Gap Lock):锁定索引记录间隙(不含该记录),确保索引记录间隙不变,防止其他事务在这个间隙进行insert,产生幻读。在RR隔离级别下都支持。
- 临键锁(Next-Key Lock):行锁和间隙锁组合,同时锁住数据,并锁住数据前面的间隙Gap。在RR隔离级别下支持。
行锁
InnoDB实现了以下两种类型的行锁:
- 共享锁(S): 允许一个事务去读一行,阻止其他事务获得相同数据集的排它锁。
- 排他锁(X): 允许获取排他锁的事务更新数据,阻止其他事务获得相同数据集的共享锁和排他锁。
共享锁和共享锁兼容,和排他锁冲突;排他锁与全部都冲突。
SQL | 行锁类型 | 说明 |
---|---|---|
INSERT | 排他锁 | 自动加锁 |
UPDATE | 排他锁 | 自动加锁 |
DELETE | 排他锁 | 自动加锁 |
SELECT(正常) | 不加任何锁 | |
SELECT … LOCK IN SHARE MODE | 共享锁 | 需要手动在SELECT之后加LOCKINSHARE MODE |
SELECT … FOR UPDATE | 排他锁 | 需要手动在SELECT之后加FOR UPDATE |
默认情况下,InnODB在 REPEATABLE READ事务隔离级别运行,InnoDB使用 next-key锁进行搜索和索引扫描,以防止幻读。
- 针对唯一索引进行检索时,对已存在的记录进行等值匹配时,将会自动优化为行锁。
- InnoDB的行锁是针对于索引加的锁,不通过索引条件检索数据,那么InnoDB将对表中的所有记录加锁,此时 就会升级为表锁。
间隙锁/临键锁
在默认情况下,InnoDB在 REPEATABLE READ事务隔离级别运行,InnoDB使用 next-key 锁)进行搜索和扫描,此时
- 索引上的等值查询(唯一索引),给不存在的记录加锁时,优化为间除锁。1.
- 索引上的等值查询(普通索引),向右遍历时最后一个值不满足查询需求时(叶子节点挂的是顺序的行数据),next-keylock 退化为间隙锁(防止插入相同索引的数据)
- 索引上的范围查询(唯一索引),会访问到不满足条件的第一个值为止
注意:间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存,一个事务采用的间隙锁不会阻止另一个事务在同一间隙上采用间隙锁。
6.InnoDB引擎
逻辑存储结构
- 表空间(ibd文件),一个mysql实例可以对应多个表空间,用于存储记录、索引等数据。
- 段,分为数据段(Leafnodesegment)、索引段(Non-leafnode segment)、回滚段(Rollbacksegment),InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段即为B+树的非叶子节点。段用来管理多个Extent(区)。
- 区,表空间的单元结构,每个区的大小为1M。默认情况下,InnoDB存储引擎页大小为16K,即一个区中一共有64个连续的页。
- 页,是InnoD8 存储引擎磁盘管理的最小单元,每个页的大小默认为16KB。为了保证页的连续性,InnoDB 存储引擎每次从磁盘申请 4-5 个区。
- 行,InnoDB 存储引擎数据是按行进行存放的。
- Trx_id: 每次对某条记录进行改动时,都会把对应的事务id赋值给trx_id隐藏列。
- Roll-pointer: 每次对某条引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
架构
MySQL5.5 版本开始,默认使用InnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。
内存架构
Buffer Pool:缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据(若缓冲池没有数据,则从磁盘加载并缓存),然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快处理速度。
缓冲池以Page页为单位,底层采用链表数据结构管理Page。根据状态,将Page分为三种类型:
- free page:空闲page,未被使用。
- clean page:被使用page,数据没有被修改过。
- dirty page:脏页,被使用page,数据被修改过,页中数据与磁盘的数据产生了不一致。
Change Buffer:更改缓冲区(针对于非唯一二级索引页),在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而会将数据变更存在更改缓冲区Change Buffer 中,在未来数据被读取时,再将数据合并恢复到BufferPool中,再将合并后的数据刷新到磁盘中。
与聚集索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引。同样,删除和更新可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO。有了ChangeBuffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO。
Adaptive Hash Index:自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控对表上各索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。
自适应哈希索引,无需人工干预,是系统根据情况自动完成。
Log Buffer:日志缓冲区,用来保存要写入到磁盘中的log日志数据(redolog、undolog),默认大小为 16MB,日志缓冲区的日志会定期刷新到磁盘中小如果需要更新、插入或删除许多行的事务,增加日志缓冲区的大小可以节省磁盘1/0。
磁盘结构
System Tablespace:系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建的,它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等)。
File-Per-Table Tablespaces:每个表的文件表空间包含单个InnoDB表的数据和索引,并存储在文件系统上的单个数据文件中。
General Tablespaces:通用表空间,需要通过CREATE TABLESPACE 语法创建通用表空间,在创建表时,可以指定该表空间。
Undo Tablespaces:撤销表空间,MySQL实例在初始化时会自动创建两个默认的undo表空间(初始大小16M),用于存储undolog日志。
Temporary Tablespaces:InnoDB 使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据。
Doublewrite Buffer Files:双写缓冲区,innoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中,便于系统异常时恢复数据。
Redo Log:重做日志,是用来实现事务的持久性。该日志文件由两部分组成:重做日志缓冲(redo logbuffer)以及重做日志文件(redo log),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都会存到该日志中,用于在刷新脏页到磁盘时,发生错误时,进行数据恢复使用。
后台线程
-
Master Thread
核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性,还包括脏页的刷新、合并插入缓存、undo页的回收。 -
IO Thread
在InnoDB存储引擎中大量使用了AIO来处理IO请求,这样可以极大地提高数据库的性能,而I0Thread主要负责这些IO请求的回调。线程类型 默认个数 职责 Read thread 4 负责读操作 Write thread 4 负责写操作 Log thread 1 负责将日志缓冲区刷新到磁盘 Insert buffer thread 1 负责将写缓冲区内容刷新到磁盘 -
Purge Thread
主要用于回收事务已经提交了的undol0g,在事务提交之后,undolog可能不用了,就用它来回收 -
Page Cleaner Thread
协助 Master Thread 刷新脏页到磁盘的线程,它可以减轻 Master Thread 的工作压力,减少阻塞。
事务原理
原子性(undo log)、持久性(redo log)、一致性 (undo log +redo log)、隔离性(锁+MVCC)
-
redo log
重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的持久性。
该日志文件由两部分组成:
重做日志缓冲(redolog buffer)以及重做日志文件(redolog file),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中,用于在刷新脏页到磁盘,发生错误时,进行数据恢复使用。
-
undo log
回滚日志,用于记录数据被修改前的信息,作用包含两个: 提供回滚 和 MVCC(多版本并发控制)。
undolog和redolog记录物理日志不一样,它是逻辑日志。可以认为当delete一条记录时,undolog中会记录一条对应的insert记录,反之亦然,当update一条记录时,它记录一条对应相反的update记录。当执行rolback时,就可以从undolog中的逻辑记录读取到相应的内容并进行回滚。
Undolog销毁:undoloa在事务执行时产生,事务提交时,并不会立即删除undolog,因为这些日志可能还用于MVCC
Undolog存储:undolog采用段的方式进行管理和记录,存放在rollback segment 回滚段中,内部包含1024个undo logsegment.
MVCC
概念
-
当前读
读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:select… lock in share mode(共享锁),select… for update、update、insert、delete(排他锁)都是一种当前读。
-
快照读
简单的select(不加锁)就是快照读,快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。- Read Committed:每次select,都生成一个快照读。
- Repeatable Read:开启事务后第一个select语句才是快照读的地方,
- Serializable:快照读会退化为当前读。
-
MVCC
全称 Multi-Version Concurrency Control,多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阴塞读功能。MVCC的具体实现,还需要依赖于数据库记录中的三个隐式字段、undolog日志、readView。
实现原理
-
记录中的隐藏字段
隐藏字段 含义 DB_TRX_ID 最近进行修改的事务ID,记录插入这条记录或最后一次修改该记录的事务的ID。 DB_ROLL_ PTR 回滚指针,指向这条记录的上一个版本,用于配合undolog,指向上一个版本。 DB_ROW_ID 隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段。 -
undo log版本链
回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志。
当insert的时候,产生的undolog日志只在回滚时需要,在事务提交后,可被立即删除。
而update、delete的时候,产生的undolog日志不仅在回滚时需要,在快照读时也需要,不会立即被删除。
undo log 版本链:不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录。但事务在进行读的时候,并不一定是读的最新版本,有可能是历史版本。
-
readview
ReadView(读视图)是 快照读 SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id。ReadView中包含了四个核心字段:
字段 含义 m_ids 当前活跃的事务ID集合 min_trx_id 最小活跃事务ID max_trx_id 预分配事务ID,当前最大事务ID+1(因为事务ID是自增的) creator_trx_id ReadView创建者的事务ID 访问规则,从最顶端的版本链开始比对,符合则返回快照(trx id:代表是当前事务ID)
- trx _id == creator_trx _id,则可以访问该版本(说明数据是当前这个事务更改的)
- trx_id<min_trx_id,则可以访问该版本(说明数据已经提交了)
- trx_id>max_trx_id,则不可以访问该版本(说明该事务是在ReadView生成后才开启)
- min_trx_id <= trx_id<= max_trx id,且trx_id不在m_ids中是可以访问该版本的(说明数据已经提交)
不同的隔离级别,生成Readview的时机不同:
- READ COMMITTED: 在事务中每一次执行快照读时生成ReadView。
- REPEATABLE READ: 仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。
7.MySQL管理
系统数据库
Mysql数据库安装完成后,自带了一下四个数据库,具体作用如下:
数据库 | 含义 |
---|---|
mysql | 存储MySQL服务器正常运行所需要的各种信息(时区、主从、用户、权限等) |
information_ schema | 提供了访问数据库元数据的各种表和视图,包含数据库、表、字段类型及访问权限等 |
performance_schema | 为MySQL服务器运行时状态提供了一个底层监控功能,主要用于收集数据库服务器性能参数 |
sys | 包含了一系列方便 DBA 和开发人员利用 performance schema 性能数据库进行性能调优和诊断的视图 |
常用工具
-
mysql
Mysql客户端工具,-e 执行SQL并退出
-
mysqladmin
Mysql管理工具
-
mysqlbinlog
二进制日志查看工具
-
mysqlshow
查看数据库、表、字段的统计信息
-
mysqldump
数据备份工具
-
mysqlimport/source
数据导入工具
原理 -
记录中的隐藏字段
隐藏字段 含义 DB_TRX_ID 最近进行修改的事务ID,记录插入这条记录或最后一次修改该记录的事务的ID。 DB_ROLL_ PTR 回滚指针,指向这条记录的上一个版本,用于配合undolog,指向上一个版本。 DB_ROW_ID 隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段。 -
undo log版本链
回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志。
当insert的时候,产生的undolog日志只在回滚时需要,在事务提交后,可被立即删除。
而update、delete的时候,产生的undolog日志不仅在回滚时需要,在快照读时也需要,不会立即被删除。
undo log 版本链:不同事务或相同事务对同一条记录进行修改,会导致该记录的undolog生成一条记录版本链表,链表的头部是最新的旧记录,链表尾部是最早的旧记录。但事务在进行读的时候,并不一定是读的最新版本,有可能是历史版本。
-
readview
ReadView(读视图)是 快照读 SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id。ReadView中包含了四个核心字段:
字段 含义 m_ids 当前活跃的事务ID集合 min_trx_id 最小活跃事务ID max_trx_id 预分配事务ID,当前最大事务ID+1(因为事务ID是自增的) creator_trx_id ReadView创建者的事务ID 访问规则,从最顶端的版本链开始比对,符合则返回快照(trx id:代表是当前事务ID)
- trx _id == creator_trx _id,则可以访问该版本(说明数据是当前这个事务更改的)
- trx_id<min_trx_id,则可以访问该版本(说明数据已经提交了)
- trx_id>max_trx_id,则不可以访问该版本(说明该事务是在ReadView生成后才开启)
- min_trx_id <= trx_id<= max_trx id,且trx_id不在m_ids中是可以访问该版本的(说明数据已经提交)
不同的隔离级别,生成Readview的时机不同:
- READ COMMITTED: 在事务中每一次执行快照读时生成ReadView。
- REPEATABLE READ: 仅在事务中第一次执行快照读时生成ReadView,后续复用该ReadView。
7.MySQL管理
系统数据库
Mysql数据库安装完成后,自带了一下四个数据库,具体作用如下:
数据库 | 含义 |
---|---|
mysql | 存储MySQL服务器正常运行所需要的各种信息(时区、主从、用户、权限等) |
information_ schema | 提供了访问数据库元数据的各种表和视图,包含数据库、表、字段类型及访问权限等 |
performance_schema | 为MySQL服务器运行时状态提供了一个底层监控功能,主要用于收集数据库服务器性能参数 |
sys | 包含了一系列方便 DBA 和开发人员利用 performance schema 性能数据库进行性能调优和诊断的视图 |
常用工具
-
mysql
Mysql客户端工具,-e 执行SQL并退出
-
mysqladmin
Mysql管理工具
-
mysqlbinlog
二进制日志查看工具
-
mysqlshow
查看数据库、表、字段的统计信息
-
mysqldump
数据备份工具
-
mysqlimport/source
数据导入工具