MySQL

最新推荐文章于 2024-03-01 11:59:17 发布

应巅

最新推荐文章于 2024-03-01 11:59:17 发布

阅读量120

点赞数

文章标签： mysql

本文链接：https://blog.csdn.net/qq_43439920/article/details/133849481

版权

MySQL

基础知识

MySQL 服务状态命令

启动：systemctl start mysqld
关闭：systemctl stop mysqld
重启：systemctl restart mysqld
查看状态：systemctl status mysqld

字符集

查看字符集
```
show variables like 'character%'
```
uft8：1~3个字节表示字符
utf8mb4：1~4个字节表示字符

比较规则

后缀	英文	描述
_ai	accent insensitive	不区分重音
_as	accent sensitive	区分重音
_ci	case insensitive	不区分大小写
_cs	case sensitive	区分大小写
_bin	binary	以二进制方式比较

MySQL 主要文件目录

数据库文件存放目录：/var/lib/mysql
相关命令记录：user/bin 和 user/sbin
配置文件目录：/etc/my.cnf
redo日志：/var/lib/mysql/ib_logfile0

表在数据库文件目录中的表示

#创建数据库
CREATE DATABASE `bank01` 
CHARACTER SET 'utf8mb4' 
COLLATE 'utf8mb4_0900_ai_ci';

创建数据库以后会创建文件夹：/var/lib/mysql/bank01

InnoDB存储引擎下创建表
```
CREATE TABLE `user01` (
    `id` int NOT NULL AUTO_INCREMENT,
    PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
```
创建表后会出现 ibd 文件：/var/lib/mysql/bank01/user01.ibd

索引、数据、表结构、数据库结构都存储在该文件中
MyISAM存储引擎下创建表
```
CREATE TABLE `user02` (
  `id` int NOT NULL AUTO_INCREMENT,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
```
创建表后会出现 .MYD 和 .MYI 文件

/var/lib/mysql/bank01/user02.MYD：数据信息文件

/var/lib/mysql/bank01/user02.MYI：索引信息文件

/var/lib/mysql/bank01/user02_361.sdi：表结构文件

在修改存储引擎以后文件会重新按照存储引擎的规则建立之前的文件会删除

在删除表以后文件会跟着删除

存储引擎

查看存储引擎：show engines;
查看系统默认存储引擎：show variables like '%storage_engine%'; 或 SELECT @@default_storage_engine;
修改默认存储引擎：SET DEFAULT_STORAGE_ENGINE=MyISAM;
在 my.cnf 中修改存储引擎：default-storage-engine=MyISAM
InnoDB 和 MyISAM 存储引擎对比

对比项 MyISAM InnoDB
外键不支持支持
事务不支持支持
行表锁表锁行锁
缓存只缓存索引不缓存真实数据不仅缓存索引还要缓存真实数据对内存要求较高

对比项	MyISAM	InnoDB
外键	不支持	支持
事务	不支持	支持
行表锁	表锁	行锁
缓存	只缓存索引不缓存真实数据	不仅缓存索引还要缓存真实数据对内存要求较高

逻辑架构

连接层

客户端访问 MySQL 服务需要创建 TCP 连接

MySQL 服务会对 TCP 连接传输过来的账号密码做身份认证和权限认证

MySQL 服务需要从线程池中提供一个线程专门与这个客户端交互
服务层
- SQL 接口：接收客户端的SQL请求并返回结果给客户端
- SQL 解析器：对客户端的SQL进行词法、语义分析将SQL分解成语法树进行语法优化 SQL重写
- SQL 优化器：生成一个执行计划用于表明使用哪些索引表之间的连接顺序存储引擎会按照执行计划来执行真正的查询
- 查询缓存：用于缓存一条 select 的执行结果在8.0版本中删除
  
  命中率不高：key 必须完全一致某些函数两次调用结果不一样
  
  缓存失效：只要表结果或者数据被修改那么缓存都会变为无效状态
引擎层

插件式存储引擎层真正负责 MySQL 中数据的存储和提取对物理服务器级别维护的底层数据执行操作

服务器通过 API 和存储引擎进行通信不同的存储引擎具有的功能不同
存储层：文件系统

索引

索引：帮助 MySQL 高效获取数据的数据结构

优点：

降低数据库 I/O 成本：数据不规则读取数据的时候磁盘的摆臂需要前后摆动查询数据数据按照一定顺序摆放的话可以减少和磁盘的交互数
保证数据的唯一性：创建唯一索引的情况下
加速表和表之间的连接：小结果集（驱动表）驱动大结果集（被驱动表）在驱动表创建索引
提高分组和排序查询的效率降低 CPU 的消耗

缺点：

创建和维护索引需要耗费时间随着数据量的增加维护时间也会增加
索引需要额外占用磁盘空间
降低表的更新速度：索引需要根据插入和更新的数据进行动态维护

InnoBD 的 B+ 树索引

在这里插入图片描述

record_type：表示记录的类型 2-最小记录 3-最大记录 1-目录页记录

next_record：记录下一行数据相对于本行数据的偏移量

为什么要创建目录页：

查询某一项数据需要变量所有数据页如果要快速定位需要对每页的数据建立一个目录即

下一页中的数据必须大于上一页中的数据把每一页最小的数据向上提生成一个目录页

聚簇索引
- 页内的数据按照主键从小到大排序形成一个单项链表
- 页与页之间通过双向链表连接
- 叶子结点存储的是完整的用户数据（所有列包含隐藏列）
非聚簇索引（二级索引）
- 叶子结点存储的是要索引列和主键值
- 如果要查询的值在索引列和主键列以外需要进行回表
- 如果要查询的值就是索引列和主键列称为覆盖索引
联合索引
- 同时将表中的多个列作为索引列本质上也是一个二级索引
- 叶子结点包含多个索引列和主键列
注意事项
1. 根页面万年不动每次重新生成一个页会将老页面的数据复制过去并清空
2. 叶子节点的数据保持唯一性所以二级索引的叶子结点会存储主键列
3. 一个页面最少存储两条记录

MyISAM 的索引

在这里插入图片描述

MyISAM 的索引文件和数据文件是分离的索引文件仅保存数据记录的地址
MyISAM 的回表是十分迅速的直接拿着偏移量到数据文件里读取数据

B树和 B+ 树

B树：平衡多叉树。左边的节点小于自己的值右边的节点大于自己的值。

在这里插入图片描述

非叶子结点既保存索引也保存数据记录

创建索引

创建表的时候创建索引
- 创建普通索引
- 创建唯一索引
- 创建主键索引
- 创建联合索引
在已经存在的表上创建索引
- ALTER TABLE table_name ADD [UNIQUE | FULLTEXT | SPATIAL] [INDEX | KEY]
  
  [index_name] (col_name[length],…) [ASC | DESC]
- CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
  
  ON table_name (col_name[length],…) [ASC | DESC]

删除索引

ALTER TABLE table_name DROP INDEX index_name;

DROP INDEX index_name ON table_name;

8.0索引新特性

支持降序索引
支持隐藏索引

InnoDB 数据存储结构

数据页

文件头：
- 4个字节存储页号
- 2个字节存储页类型
- 4个字节存储指向上一页的指针
- 4个字节存储指向下一页的指针
- 4个字节存储校验和：为了检查一个数据页是否完整
  
  当一个页在内存中修改了在同步之前需要把校验和算出来
- 8个字节存储页面最后被修改时对应的日志序列位置
文件尾
- 4个字节存储校验和
  
  会和文件头里的校验和进行比较
- 4个字节存储最后被修改时对应的日志序列位置
空闲空间：存储的记录会按照指定的行格式存储到空闲空间
用户记录：各个数据之间形成单链表
最大最小记录：这两条记录不是用户定义的记录
页目录：记录是以单项链表的方式进行存储的查询效率不高专门为记录做了一个目录通过二分法进行检索提高效率
- 将所有的记录分成几个组这几个组包含最大记录和最小记录但不包括已删除的记录
- 第一组：最小记录所在的组
- 最后一组：最大记录所在的组
- 其余组：记录在4~8条之间
页面头部：存储的记录的状态信息本页第一条记录的地址、本页存储了多少条记录等

行格式

MySQL 默认行格式：SELECT @@innodb_default_row_format; dynamic

Compact 格式

一条完整的记录被分为：记录的真实数据 + 记录的额外信息

变长字段长度列表：2个字节。针对一些变长的数据类型如varchar/text/blob 存储的字节数是不固定的所以我们存储的时候需要把这些数据占用的字节数存储起来 存储的变长长度和字段顺序是反过来的
Null 值列表：1个字节。把值可以为 Null 的列统一管理起来如果表中没有存储 Null 的列那么这个列表也不存在
记录头信息
- delete_mask：删除标记所有要被删除的记录会被组成垃圾链表方便重用空间
- min_rec_mask：非叶子结点的最小记录都会添加这个标记值为1
- record_type：2-最小记录 3-最大记录 1-非叶子结点 0-普通记录（叶子结点）
- heap_no：当前记录在本页中的位置从2开始 0 和 1分别对应最小记录和最大记录
- o_owned：页目录中每个组的最后一条记录存储该组中有多少条记录
- next_record：从当前数据到下一条数据的偏移量
记录的真实数据：包含三个隐藏列
- DB_ROW_ID：如果一个表没有主键或者唯一索引则会按照 row_id 创建聚簇索引
- DB_TRX_ID：事务ID
- DB_ROLL_PTR：回滚指针

Dynamic 格式

行溢出：InnoDB 存储引擎可以将一条记录中的某些数据存储在真正的数据页面之外

在 Dynamic 下会把占用存储空间非常大的列分散存储在其它页中进行分页存储并在记录真实数据处用 20个字节存储指向这些页的地址

Explain分析工具的使用

列名	描述
id	在一个大的查询中每一个 select 都对应一个唯一的id 从id大的开始执行
select_type	select 关键字对应的查询类型
table	表名
partitions	匹配的分区信息
type	针对单表的访问方法
possible_keys	可以用到的索引
key	实际用到的索引
key_len	实际用到的索引长度
ref	当使用索引列等值查询时与索引列进行等值匹配的对象信息
rows	预估需要读取的记录条数
filtered	经过搜索条件过滤后剩余记录条数的百分比
Extra	额外信息

id：如果id相同则认为是一组从上向下执行 id值越大优先级越高

select_type：查询类型。SIMPLE、PRIMARY、UNION、SUBQUERY等

type：结果值从好到坏依次是：system > const > eq_ref > ref > fulltext > ref_or_null > index_merge >

unique_subquery > index_subquery > range > index > ALL

key_len：长度计算公式 utf8=3 + 变长=2 + Null值=1 即varchar(1) 索引长度 = 6

Extra：Using where、Using index、Using join buffer、Using filesort

索引优化与查询

索引失效案例
- 全值匹配我最爱
- 最佳左前缀原则
- 计算、函数、类型转换（自动或手动）导致索引失效
- 范围条件的右边的索引列失效
- 不等于索引失效（is not null 无法使用索引）
- 以 % 开头的查询索引失效
- or 前后存在非索引列导致索引失效
join 语句原理
- Index Nested-Loop Join（索引嵌套循环）
  1. 从表 t1 中读取一条数据 R
  2. 从数据 R 中取出字段 A 到表 t2 中查找
  3. 取出表 t2 中满足的行和 R 组成一组作为结果集的一部分
  4. 重复1~3 直到表 t1 的末尾
  对 t1 表进行了全表扫描
  
  对 t2 表进行了索引扫描
- Simple Nested-Loop Join（简单嵌套循环）
  
  即对 t2 表没有建立索引此时 t1 和 t2 表都是全表扫描
- Block Nested-Loop Join（块嵌套循环）
  
  添加 join_buffer 减少了 I/O 次数一块一块的扫描不再是逐条获取
排序优化

where 避免全表扫描

order by 避免 FileSort
- filesort 算法：
  - 双路排序（慢）：两次扫描磁盘最终得到数据。先从磁盘读取 order by 的列进行排序。然后再从磁盘读取其它字段。
  - 单路排序（快）：一次扫描磁盘。从磁盘读取所有列。会使用更多的内存空间。
分页优化
- 在索引上完成分页操作然后根据关联的主键回原表查询需要的字段
- 在自增的索引列上把limit 换成范围查询
索引下推（index condition pushdown）

首先找到满足的索引记录区间然后在索引上直接进行过滤将过滤后的索引记录进行回表。

如果不使用索引下推会找到满足的索引记录后直接回表然后对回表的记录进行过滤。

数据库的设计范式

范式：数据表设计的基本原则、规则。

第一范式：表中的每个字段必须具有原子性
第二范式：所有非主键字段必须完全依赖主键
第三范式：所有非主键字段必须直接依赖主键不能通过其它字段间接依赖主键

消除了数据冗余但是增加了查询成本需要关联多张表

事务

事务：一组逻辑操作单元是数据从一种状态变换成另一种状态
事务的特性：（ACID）
- atomicity：原子性。事务是一个不可分割的工作单位。要么一起成功要么一起失败。（undo日志）
- consistency：一致性。执行事务前后数据从一个合法的状态变成另一个合法的状态这种状态是语义上的。（undo日志）
- isolation：隔离性。一个事务执行时不能被其它事务干扰。（锁机制）
- durability：持久性。数据库中的数据的改变是永久性的。（redo日志）
事务的隔离级别：
- 脏写：事务A提交了修改事务B也提交了修改事务B将事务A的提交覆盖了
- 脏读：事务A修改后没有提交事务B读取了事务A修改的数据此时事务A回滚了读取的数据临时且无效
- 不可重复读：事务A第一次读取的字段和第二次读取的字段不一致因为事务B在事务A进行读取的前后修改了字段并提交
- 幻读：事务A读取表中的某个范围事务B对表中进行插入操作事务A再读取这个范围发现多了数据
SQL 中的隔离级别：

数据库的所有隔离级别都能解决脏写问题
- 读未提交：所有事务都能看到其它事务没有提交的数据。不能避免脏读、不可重复读、幻读。
- 读已提交：一个事务能看到其它事务已经提交的数据。不能避免不可重复读、幻读。
- 可重复读：事务A在读到一条数据后在当前事务中读到的还是原来的数据。（MySQL 的默认隔离级别）
- 串行化：在一个事务执行的期间禁止其它事务对该表进行操作。

事务日志

redo日志

为什么需要 redo 日志

缓冲池可以帮助我们消除 CPU 和磁盘之间的鸿沟 checkpoint 机制可以保证数据的最终落盘

然而 checkpoint 并不是每次变更的时候就触发 而是 master 线程隔一段时间去处理

最坏的情况是事务提交以后刚写完缓冲池数据库宕机了那么这段数据就是丢失的无法恢复

如何保证这部分数据的持久性呢？

将修改的数据记录一下下次数据库重启的时候能将这部分数据恢复出来

redo 日志的刷盘策略

InnoDB 引擎会在写 redo_log 的时候先写 redo_log_buffer 之后以一定的频率刷入到真正的 redo_log 文件中这里的一定频率可以通过 show variables like '%innodb_flush_log_at_trx_commit%';进行查看并修改：
- 设置为0：表示每次事务提交的时候不进行刷盘操作（后台线程每隔一秒将 redo_log_buffer 中的内容写入 page_cache）
- 设置为1：表示每次事务提交时都进行刷盘操作（默认值）
- 设置为2：表示每次事务提交都只把 redo_log_buffer 中的内容写入 page_cache 由操作系统决定何时同步到磁盘。

undo日志

保证了数据的原子性和一致性
多版本并发控制提供支持

在这里插入图片描述

多版本并发控制

MVCC（Multiversion Concurrency Control）：通过数据行的多个版本来实现数据库的并发控制。保证 InnoDB 引擎在一致性读的情况下有了保证。

每一个行中包含三个隐藏字段其中

事务id：每一个事务对某条聚簇索引记录进行修改时会把该事务id 复制给该列

回滚指针：每次对聚簇索引记录进行改动时都会把旧的记录写 undo 日志中然后这列就相当于一个指针通过它找到该记录修改前的信息

ReadView

可读视图相当于一个快照主要用作判断数据的可见性

ReadView 包含四个比较重要的内容：
1. creator_trx_id：创建 ReadView 的事务id（select 语句的事务id为0）
2. trx_ids：表示当前生成 ReadView 时系统中活跃的事务id列表
3. up_limit_id：活跃事务中id最小的一个
4. low_limit_id：系统应该分配给的下一个事务id
ReadView 的规则
- 如果访问版本的 trx_id 属性值（行隐藏字段）与 ReadView 中的 creator_trx_id 值相同意味着当前事务在访问它自己修改的记录所以该版本可以被当前事务访问
- 如果访问版本的 trx_id 属性值（行隐藏字段）小于 up_limit_id 表示是生成 ReadView 之前的事务所以该版本可以被当前事务访问
- 如果访问版本的 trx_id 属性值（行隐藏字段）大于等于 low_limit_id 表示是生成 ReadView 之后的事务所以该版本不可以被当前事务访问
- 如果访问版本的 trx_id 属性值（行隐藏字段）在 up_limit_id 和 low_limit_id 之间需要判断一下 trx_id 是否在 trx_ids中：
  - 如果在说明生成 ReadView 时该版本的事务还是活跃的所以不能访问
  - 如果不在说明生成 ReadView 时该版本的事务已经提交所以可以访问
读已提交隔离级别下的 MVCC：每次读取数据都会重新生成一个 ReadView
可重复读隔离级别下的 MVCC：只有第一次读取数据才会生成 ReadView

锁

共享锁：针对同一份数据多个事务可以同时进行操作互相不阻塞

排它锁：当前锁没有释放的时候会阻断其它锁的进入

表锁

表级别的共享锁和排它锁
意向锁
- 实现了表锁和行锁的共存
- 意向锁由存储引擎自己维护
自增锁：AUTO_INCREMENT 属性
元数据锁：DML 操作时

行锁

记录锁：仅仅把一条记录锁上
间隙锁：某个区间的记录会被锁上防止幻读的出现
临键锁：既想锁住某条记录也想锁住间隙的记录
插入意向锁：一个事务在插入一条记录时需要判断一下插入位置是不是被别的事务加了间隙锁

主从复制

bin_log

bin_log：二进制日志文件记录了数据库所有执行的 DML 和 DDL 等数据库更新事件语句但不包含没有修改任何数据的语句（select、show等）
bin_log日志主要用于数据恢复和数据复制

查看默认情况

show variables like '%log_bin%';

+---------------------------------+-----------------------------+
| Variable_name                   | Value                       |
+---------------------------------+-----------------------------+
| log_bin                         | ON                          |
| log_bin_basename                | /var/lib/mysql/binlog       |
| log_bin_index                   | /var/lib/mysql/binlog.index |
| log_bin_trust_function_creators | OFF                         |
| log_bin_use_v1_row_events       | OFF                         |
| sql_log_bin                     | ON                          |
+---------------------------------+-----------------------------+

查看日志

当 MySQL 创建二进制文件的时候会先创建一个 log_bin_index 文件在创建一个以 “.000001” 为后缀的文件

MySQL 每重启一次文件的后缀就会增加一个如果日志长度超过了 max_binlog_size的上限会创建一个新的日志文件

在shell 命令行执行：mysqlbinlog -v “/var/lib/mysql/binlog.000001”

也可以在 mysql 命令行执行查看偏移量

show binlog events in ‘binlog.000001’;

使用日志恢复数据

mysqlbinlog [option] filename|mysql –u user -p pass;

filename：文件名

option：

--start-position和–stop-position：指定恢复的开始位置和结束位置

--start-date 和 --stop-date：指定恢复的开始时间和结束时间

二阶段提交

在执行更新语句的时候 redo_log 会在事务执行的过程中不断写入而 bin_log 只会在事务提交的时候写入

两份日志的写入时机不一致

如果redo_log 和 bin_log 两份日志之间的逻辑不一致会出现什么?

当redo_log 写入正常在写入 bin_log 的时候 MySQL 程序异常 InnoDB提供了两阶段提交方案。

开始事务更新数据
写入 redo_log 的准备阶段
提交事务同时写入 bin_log 然后redo_log 设置提交阶段

如果在 bin_log 发生异常发现 redo_log 没有提交则回滚

如果redo_log 提交发生异常虽然redo_log 处于准备阶段但是bin_log 是完整的会进行恢复

relay_log 中继日志

中继日志只存在于主从服务架构的从服务器上。

从服务器为了与主服务器保持一致要从主服务器上读取 bin_log 日志并把读取到的信息写入本地的 relay_log

然后从服务器读取中继日志的内容对从服务器的数据进行更新

在这里插入图片描述

如何解决一致性问题？

主从同步的内容是二进制文件进行网络传输就一定会存在延迟

Master 等到组内大多数 Slave 更新完毕后再返回达成最终一致性

应巅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySQL

MySQL 服务状态命令字符集查看字符集uft8：1~3个字节表示字符utf8mb4：1~4个字节表示字符比较规则MySQL 主要文件目录user/binuser/sbin表在数据库文件目录中的表示InnoDB存储引擎下创建表索引、数据、表结构、数据库结构都存储在该文件中MyISAM存储引擎下创建表创建表后会出现 .MYD 和 .MYI 文件：数据信息文件：索引信息文件：表结构文件在修改存储引擎以后文件会重新按照存储引擎的规则建立之前的文件会删除在删除表以后文件会跟着删除存储引擎或。
复制链接

扫一扫