《MySQL是怎么运行的：从根儿上理解MySQL》(1-5)学习总结

最新推荐文章于 2025-04-20 16:54:01 发布

月亮的-影子

最新推荐文章于 2025-04-20 16:54:01 发布

阅读量1.9k

点赞数 11

分类专栏： mysql 文章标签： mysql 服务器数据库

本文链接：https://blog.csdn.net/m0_46388866/article/details/121056570

版权

mysql 专栏收录该内容

15 篇文章

订阅专栏

本文详细介绍了MySQL的工作机制，包括客户端与服务器的交互、文件结构、查询优化和存储引擎。深入探讨了InnoDB存储引擎的行格式、数据页结构以及字符集和比较规则。重点分析了InnoDB的行溢出数据、页目录和页头部等关键概念，帮助读者理解MySQL内部的存储和访问机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

说明

文章的图片来源《MySQL是怎么运行的：从根儿上理解MySQL》，欢迎大家买一本看看，对于mysql是由浅入深的讲解非常细致

1.mysql的工作机制

客户端发送命令
服务器端接收并且处理

1.文件

mysqld：服务器程序
mysqld-safe：启动脚本，监控程序
mysql-server：启动脚本，简介调用mysqld-safe
mysqladmin、mysqldump：客户端

2.mysql使用的协议

使用的是TCP协议进行请求和应答

3.连接管理

服务器端会通过开启线程来与客户端进行连接，如果断开连接之后线程会被缓存并且等待下一次的连接

4.解析和优化

查询缓存

就是查询的请求和结果缓存起来
但是缓存失效太快，mysql没有人聪明，就算是缓存了一次结果，但是由于请求一点点不同都不会命中缓存，而且表只要发生修改就需要重新加载缓存，缓存失效

语法解析

相当于就是一个编译的过程

查询优化

对语句进行优化，比如连接使用的索引，使用什么索引，需不需要调换表的位置。相当于就是一个执行计划

存储引擎

数据的存储和提取操作都在存储引擎
怎么把数据写到数据库上，读取都是引擎的工作

2.启动和配置文件

启动选项

比如客户端允许连接数，使用的存储引擎等。

配置文件的使用选项

my.ini或者是my.cnf

配置文件内容

server，作用与所有服务器端的启动配置
mysqld
client，作用与所有客户端的启动配置
mysql
mysqladmin

格式就是option1=xxx

启动命令可以读取的分组

mysqld 启动服务器 [mysqld]、[server]
mysqld_safe 启动服务器 [mysqld]、[server]、[mysqld_safe]
mysql.server 启动服务器 [mysqld]、[server]、[mysql.server]
mysql 启动客户端 [mysql]、[client]
mysqladmin 启动客户端 [mysqladmin]、[client]
mysqldump 启动客户端 [mysqldump]、[client]

系统变量

影响程序行为的变量，比如max_connections、default_storage_engine
修改变量可以通过修改my.ini的[server]里面的变量

系统变量的作用范围

不同客户端可能需要不同引擎之类的，就需要系统变量的范围，能够让客户端互不干扰。

global：全局变量，影响服务器
session：会话变量，影响一个客户端
某个客户端修改global不会影响当前客户端的系统变量，但是会影响后面进来会话的变量

-- set session default_storage_engine=MyISAM
-- show session variables like "default_storage_engine"\
show global variables like 'default_storage_engine';

状态变量

Thread_connected多少个线程正在连接
他们的值只能是程序自己来进行配置

show status like 'thread%'

3.字符集和比较规则简介

怎么存储字符集？

建立字符和二进制之间的关系

哪些字符映射为二进制数据
怎么映射

字符映射成二进制这个过程也可以叫做编码，二进制映射回字符就是解码

常见字符集

acsii：128个字符
utf-8：基本上收录世界上的所有字符

Mysql支持的字符集

utf-8
utf-8mb3：减少某些字符的存储字节，为了提升系统的性能
支持41种字符集show charset

字符集的比较规则

SHOW COLLATION LIKE ‘utf8_%’;展示utf-8的所有比较规则

show variables like 'CHARACTER_set_server’查看服务器级别的字符集
show variables like 'collation_server’查看字符集的比较规则
只修改字符集，就会修改为当前字符集的默认比较规则
修改默认比较规则，那么字符集就会被修改为比较规则对应的字符集

字符集的作用

比如一个’我’在GBK里面占用的字节是4，但是到utf-8就是6个字节。合理使用字符集可以减少资源占用

字符集的转换

如果客户端和服务器端并不是使用同一个字符集，造成的问题就是乱码。根据上面的字符集的作用，也知道gbk解码和utf-8解码的同一个字符都是不同的方法。
客户端和服务器实际上交流也是通过字符串，这里有三个重要系统变量

character_set_client服务器解码使用的字符集
character_set_connection服务器处理请求会把character_set_client转换为character_set_connetion
character_set_results 服务器向客户端返回数据使用的字符集

客户端发送使用的是character_set_client，这个时候服务器转换到connection的时候也是这么认为的，如果客户端采用的是不同的编码就会导致转换失败
character_set_result是服务器发送给客户端的，客户端的解码一定是要跟character_set_result设置的是一样才能够解码成功
character_set_connetion相当于就是一个转换器，交给服务器去处理。但是如果character_set_connetion中有不认识的字符也会导致最后的错误.比如utf-8->ascii
如果希望修改client字符集只需要在ini中[client]配置default-character-set=utf8

总结

字符集是某个字符范围的编码规则
比较规则是字符串比较的一种方式
一个比较规则对应一个字符集
字符集的比较规则四个级别

服务器级别
数据库级别
表级别
col级别

字符集从客户端转换到服务器端

4.Innodb存储结构

表的数据存到了哪里？
什么格式存储？
mysql以什么方式来访问这些数据

innodb简介

发生数据处理是在内存
innodb获取数据并不是一行一行地读而是把数据分成很多个页，一个页一个页地读，通常是16KB

Innodb的行格式

Compact格式

一条完整的记录

额外信息
真实数据

变长字段长度列表

各种varchar 、blob、varbinary、text
分为了两个部分

真正数据内容
占用字节数

实际上就是保存了每个列的一个字节长度到底是多少，而且按照列的逆序来排序。
这里区分是两个字节还是一个字节主要是看第一个二进制是不是0，如果是0那么就是单独一个字节，如果不是那么就是两个字节

null列表值

也是对应列的逆序，1即使null，0就是非null。意思就是列的值是否是null
而且规定一定就是一个字节，如果null不够，那么就在高位补0。

比如这里只有3个值是null，那么很自然就是倒序的二进制位是1.c1列最后，c3倒数第二，c4倒数第三

记录头信息

五个字节组成

预留位1：没有使用
预留位2：没有使用
delete_mask:标记记录是否被删除
min_rec_mask:B+树每层非叶子节点最小记录都会添加这个标记
n_owned:拥有的记录数
heap_no:表示堆的位置
recode_type:表示记录的类型，0普通记录、1是B+树的非叶子节点记录、2是最小记录、3表示最大的记录
next_record:表示下一条记录的相对位置

记录真实数据

除了主要的数据还有几个隐藏的列

row_id:行id
transaction_id:事务id
roll_pointer:回滚指针
这里的第一条记录的c3的占用字节（char(10)）是10个，但是实际上只是使用了’cc’就是0x6363后面全部使用0x2020来进行填充那些不需要使用的字节
第二个记录里面的c3和c4已经是null，索引存储到了null记录后面就不占用任何字符了。