【04】MySQL：存储引擎

最新推荐文章于 2024-07-26 17:12:54 发布

weixin_30247307

最新推荐文章于 2024-07-26 17:12:54 发布

阅读量100

点赞数

文章标签：运维操作系统数据库

原文链接：http://www.cnblogs.com/Dy1an/p/11393045.html

版权

写在前面的话

在使用 Linux 的时候，可以经常听到有关文件系统 FS（File System）的东西，MySQL 也有属于自己类似的东西，那就是存储引擎。之前在创建数据表的时候，在 Create table 后面一般都加了 engine=innodb。这就是指定存储引擎。

关于存储引擎

可以将存储引擎就当作 Linux 而言的文件系统，其主要功能在于：数据读写 / 安全 / 一致性，提升读写性能，提供热备份，自动故障恢复，高可用等。

需要知道的存储引擎大致有：InnoDB，MyISAM，MEMORY，ARCHIVE，CSV，BLACKHOLE，MERGE，NDBCLUSTER，EXAMPLE 等

查看数据库支持的存储引擎：

show engines;

结果：

值得注意的是，存储引擎针对的对象是表，这意味着一个库中，可能存在多种存储引擎，例如：

select TABLE_NAME,ENGINE from information_schema.tables where TABLE_SCHEMA="mysql";

结果：

对于 MySQL 的两大分支 Percona 和 MariaDB 的存储引擎：

Percona：默认 XtraDB

MariaDB：默认 InnoDB

同样也有其它的存储引擎：TokuDB，RocksDB，MyRocks 等。

这三种存储引擎有一个共同特点，压缩比较高，数据写入性能高，在使用 Zabbix 监控超多主机时候可以考虑这种。

常见优化建议

1. Zabbix 由于监控的服务器数量太多，数据保留天数长，数据量大，导致平台卡慢，磁盘容量写满，优化建议：

a. 查看 MySQL 版本，对于这类并非超级重要的数据，数据库版本尽可能新，如 8 版本，性能优化明显。

b. 更换数据库存储引擎，默认一般 InnoDB，但是对于这类读写频繁的，可以考虑更换为 TokuDB 这类。

c. 定期清理数据，由于 delete 删除并不会立即释放，可考虑将表按月拆分，使用 drop 或 truncate 删除，当然相对麻烦。

d. 关闭 binlog 和双 1，和上面一样，由于数据不重要，所有没必要这些功能，导致影响性能。

e. 其它的一些优化，如关闭安全性参数，进而提高性能。

2. InnoDB 和 MyISAM 之间存储引擎替换：

由于 MyISAM 是表级锁，性能极差，且不支持事务，在突然断电时会导致数据丢失，所以建议替换为 InnoDB。

3. 由于业务数据量大，程序中的删除并不会释放出空间，而且需要按月删除历史数据，处理办法：

a. 将数据全导出，手动 drop 表重建导入，这样就能释放出空间。

b. 对于需要按月数据清理，可以按月分表，业务使用 truncate 处理旧数据。

关于 InnoDB

先看一张表，在 MySQL 5.5 之后默认的存储引擎就是 InnoDB：

这是 InnoDB 存储引擎支持的功能，其主要优点可以归纳为以下几个（针对于 MyISAM）：

a. 支持事务（Transaction）

b. MVCC（Multi-version Concurrency Control，多版本并发控制）

c. 行级锁（Row-Level Lock）

d. ACSR（Auto Crash Safey Recovery，自动故障恢复）

e. 热备份（Hot Backup）

f. Replication / GTID / 多线程

操作存储引擎

1. 查看系统默认存储引擎：

select @@default_storage_engine;

结果：

当然，也可以更换为：

show variables like "%engine%";

结果：

2. 修改默认存储引擎：

set default_storage_engine="MyISAM";

结果：

但是这种设置方法存在一个问题，退出登录下次再登录又变回去了，也就是该配置只再当前会话起作用。

设置全局生效的方法：

set global default_storage_engine="MyISAM";

此时当前会话查看是不会生效的，需要退出登录然后重新登录查看：

当然，这样并不会永久生效，重启数据库以后会恢复为之前的，永久生效的方法是在：/etc/my.cnf 中添加：

[mysqld]
default_storage_engine=myisam

可以将 global 和修改配置文件结合起来使用，这样就能实现不用重启数据库并永久生效的目的。当然，肯定还是使用 InnoDB。

3. 查看每个表的存储引擎：

show create table city\G

结果：

当然也可以使用：

show table status like "city"\G;

结果：

实在还不行就使用 information_schema.tables 查看：

select table_name,engine from information_schema.tables where table_name="city" and table_schema="world";

结果：

4. 修改表的存储引擎：

alter table student engine MyISAM;

结果：

批量修改：

select concat("alter table ",table_name," engine tokudb;") from information_schema.tables where table_schema="school" into outfile "/tmp/1.sql";

前面用过这个语句，只需要注意 /tmp 目录在配置文件中配置 security 信任。

InnoDB 物理存储结构

查看 MySQL 数据目录：

简单的对文件进行说明：

a. ibdata1：系统数据字典信息，UNDO 表空间等数据。

b. ib_logfile0~1：REDO 日志文件，事务日志文件。

c. ibtmp1：临时表空间磁盘位置，用于存储临时表。

d. 其它目录：单独的库。

e. 目录下 frm 文件：存储表的列信息。

f. 目录下 ibd 文件：存储数据和索引。

表空间

1. 共享表空间：

将所有数据存储到同一个表空间中，管理起来比较混乱。

在 5.5 版本中出现，属于默认的存储方式。

在 5.6 版本中只用于存储数据字典信息，undo，临时表。

在 5.7 版本中，临时表也被单独出来。

在 8.0 版本中，undo 也被单独出来。

可以查看共享表空间的设置：

select @@innodb_data_file_path;

如图：

初始时候为 12 M，自动扩展。

查看扩展设置：

show variables like '%extend%';

结果：

可以知道每扩展一次增加 64M。当然这个规则是可以修改的，同样也可以修改共享表空间的增加规则，如：

innodb_data_file_path=ibdata1:512M:ibdata2:512M:autoextend

这个的意思是初始 512M，第一次扩展也加 512M，后面的扩展就按照配置自动增加。

当然，这些配置一般都是在数据库初始化的时候去设置的，后面一般不怎么动它。

2. 独立表空间：

从 5.6 开始，默认表空间转为独立表空间，主要用于存储用户数据。其特点为一个表两个文件：

frm 用于存储表结构，ibd 用于存储索引和数据行。值得注意的是：

表数据（元素据） = （ibdatax + frm） + ibd

其中 MySQL 存储引擎的各种日志：

Redo log：if_logfilex，重做日志

Undo log：ibdatax，存储在共享表空间中，回滚日志

临时表：ibtmpx，jion union 等产生的数据临时存储

查看独立表空间的设置：

select @@innodb_file_per_table;

结果：

1：说明开启独立表空间，也就是每个表分开存储。

数据恢复案例

有这样一个数据库，没有任何最新备份，在某天突然断电，导致服务器启动后只读，无法使用。

使用 fsck 修复磁盘后，服务器启动成功，但是 MySQL 数据库丢失了某些数据，再也无法启动。

目前手里只要一份老的数据备份。该数据库已经是独立表空间，如何恢复数据到最新：

分析：

1. 由于目前数据库无法启动，所以无法得知该数据库里面的最新表结构，也无法直接捞出 SQL 进行导出恢复。

2. 目前有所有表的 ibd，frm 的文件，但是由于其他库文件异常，导致共享表空间 ibdatax 文件中有些错误，所有才会导致数据库无法启动。

3. 由于备份是旧的，唯一能够提供使用也就只有表结构了。

由此，可以根据上文中的结论：

表数据 = ibdatax + frm + ibd

其中 ibdatax 有错误，无法使用，frm 依赖于 ibdatax，如果我们直接拷贝到新机器上面，也不能使用。

最后我们唯一能够使用的就是数据 ibd，这本身也是最关键的东西。

恢复过程：

1. 旧的备份，故障解决的第一步都是备份，不能直接操作，否则出问题将永久无法恢复。

2. 新服务器建立一个一模一样的数据库，将旧数据导入，这样带来的好处是该数据的 ibdatax 和 frm 是正常的。但是 ibd 的数据是旧的。

3. 将故障服务器的 ibd 文件拷贝到新库下面，然后进行恢复。具体操作可以查看下面的测试：

故障预演测试：

1. 在服务器 192.168.100.111 上面有个 school 库，下面有表：

2. 在服务器 192.168.100.112 上面有一个新数据库。

3. 我们先做个测试，将 111 上面的 school 的目录拷贝到 112 上面看能不能使用：

cd /data/data/mysql/
scp -r school/ root@192.168.100.112:/data/data/mysql/

此时前往 112 上面修改刚刚传过来的文件权限：

cd /data/data/mysql/
chown -R mysql.mysql school/

在 112 上面数据库查看：

可以发现 use 和 show tables 都是没问题的。此时试试查询：

select * from sc;

结果：

报错表不存在，可是明明 show tables 都还在的。这里的原因就是 ibdatax 文件的问题，我们直接拷贝过来其实际是无法使用的。

4. 将 school 目录先移走，然后将旧的数据库导入，由于之前有过 school 库，虽然移走，但是也有问题，建议重启数据库再导入。

否则可能报错：

ERROR 1146 (42S02): Table 'xxx doesn't exist

导入之后我们可以查看：

由于我这里测试只是允许了建表语句，所以 select 的时候是空的。

5. 删除独立表空间中存放数据行和索引的文件，也就是 ibd 文件：

alter table course discard tablespace;
alter table sc discard tablespace;
alter table student discard tablespace;
alter table teacher discard tablespace;

结果：

查看 112 服务器上面该库的文件情况：

可以发现，所有的 ibd 文件都不见了。

6. 将故障服务器的 ibd 文件拷贝过来：

注意，过来的 ibd 文件可能是 root 权限，需要修改为 mysql 用户权限，执行恢复：

alter table course import tablespace;
alter table sc import tablespace;
alter table teacher import tablespace;
alter table student import tablespace;

如果报错，可以重启 MySQL 在执行：

7. 查看恢复结果：

恢复成功！

故障总结：

a. 由于我们是测试，恢复比较容易，但是实际生产中往往很复杂，比如表间关系乱七八糟的还可能导致数据导入失败，可以使用：set foreign_key_checks=0 跳过外键检查再导入。

b. 我们最终想要的还是表结构，所以表结构一定要正确，如果缺少，需要补上。然后再执行 discard 删除 ibd 文件。

c. 这里表少可以一个一个的执行，生产表可能会很多，可以使用之前的 select concat xxx into outfile 来生成批量脚本。

d. 最最最重要，一直牢记在心，备份第一位，然后再操作。

事务 ACID

Atomic：原子性，所有语句被当作一个单元全部执行或者取消，不存在执行一半的情况。

Consistent：一致性，如果数据库在事务开始时处于一致，则在执行期间依旧保留一直。

Isolated：隔离性，事务之间互不影响。

Durable：持久性，事务在执行完成后所有变更将记录到数据库中，变更不会消失。

事务在 5.5 以前的版本需要先执行 begin，之后版本不需要：

begin;

事务结束的标志为：

-- 提交
commit;
-- 或者回滚
rollback;

自动提交 autocommit：

1. 查看是否开启自动提交：

select @@autocommit;

结果如图：

2. 关闭 autocommit：

-- 当前会话临时关闭
set autocommit=0;
-- 所有会话关闭，重启后消失
set global autocommit=0;

3. 永久关闭 autocommit：在 /etc/my.cnf 加入

autocommit=0

建议将自动提交关闭，可以提升数据库性能。

隐式提交语句：

在 MySQL 中有一些语句能够自动触发提交功能，不需要手动 commit。

1. 连续 begin：

begin;
sql a;
sql b;
begin;

当再次出现 begin 的时候就会触发提交。

2. DDL 语句：如 alter / create / drop

3. DCL 语句：如 grant / revoke / set password

4. 锁定语句：lock table / unlock table

5. truncate table / load data infile / select for update

开启事务测试：

1. 首先查看是否关闭自动提交：

select @@autocommit;
-- 或者
show variables like "autocommit";

2. 测试删除回滚：

begin;
-- 删除数据
delete from student where sname="张三";
-- 查看删除后的结果
select * from student;
-- 回滚
rollback;
-- 查看结果
select * from student;

如图：

InnoDB 中 redo / undo

整体过程：

begin;
update A to B;
commit;

1. 原始的提交过程：

简要说明：

在没有使用 undo 和 redo 的时候，想要把 A update 成 B，需要步骤 1 先从 page 中读出 16K 数据页到 page buffer 中，将 A update 成 B 再度通过步骤 2 将整个数据页写回来。

其问题在于每次读取一个数据页，IO 开销相当大，资源浪费，性能差。

2. 加入 redo 后操作：

简要说明：

同样的更新过程，通过步骤 1 将 A 数据读取到 page buffer 中，此时 update A to B，并立即将这个更改过程通过步骤 2 记录到 redo buffer 中。此时执行 commit，触发步骤 3，将单条记录变更写到 redo 中。

在这过程中，为了保持数据一致性，数据库拥有日志序列号 LSN，经过步骤 1 之后执行 update，此时 LSN 会自加 1，同时生成事务号 TXID，并跟随数据一起最终持久化到 redo 中。LSN 是和源数据中 LSN 对比确认数据是否变更。最终保持一致，完成更新。TXID 则是为了标记事务本身。

当写入 3 以后，数据库挂了。此时重启数据库会发现源数据中 LSN 和 redo 中 LSN 不一致，触发数据库 CSR 自动故障恢复。将 redo 中的不一致部分读取到 redo buffer，在回到 page buffer cache 中，触发 CKPT 最终写入 page 中，保证数据的一致性，这就是前滚操作。

执行过程中的概念：

redo：重做日志，ib_logfile0~1，默认 50M，轮询使用。

redo log buffer：redo 内存区域。

ibd：存储数据行和索引。

buffer pool：缓冲区池，数据和索引的缓冲。

LSN：日志序列号，磁盘数据页，redo log，buffer pool，redo buffer 中都有，MySQL 每次启动都会比较磁盘数据页和 redo log 中的 LSN，当一致时才能正常启动。

WAL：write ahead log，日志优先写的方式持久化，意味着在 commit 之后，变更只有写到了 redo log 中就代表持久化完成。

脏页：内存中发生了修改，在没写入磁盘之前，该内存页就叫脏页。

CKPT：check point，检查点，将脏页写入磁盘的动作。

TXID：事务号，每一个事务都具备，伴随整个事务。

3. undo 回滚操作：

简要说明：

当开启事务，update 将数据读取到 page buffer 的时候，它的旧的值和 LSN 这些会被同步保存到 undo buffer 和 undo 中，另外也会被执行 update，当我们最终并不是执行 commit 而是执行 rollback 的时候，就会将 undo 中的数据再次读出来持久化到磁盘 page 中。

同事也会出现另外的情况，多个事务提交过程中，有些需要提交，有些并没有提交。此时数据库挂了，当重新启动的时候触发 CSR，通过 redo 中执行日志，如果有 commit 标记的就会走 redo，如果没有的则会走 undo 回滚。

InnoDB 中锁 / 隔离级别

在 MySQL 中的锁为行级锁（悲观锁），谁先操作这行谁就具有这行的执行权力：

1. 新开一个窗口，执行一个事务，不提交：

2. 新开另外一个窗口，也去修改这一行：

可以发现卡住了，无法执行。过一段时间会报错：

提示锁等待超时，当然此时修改其它行是没问题的。在 InnoDB 的锁是行级锁，但是在 MyISAM 中则是表级锁，MyISAM 中没有事务，直接锁表。

另外还有乐观锁，就是没有锁，redis 就是这样。

隔离级别（transaction_isolation），负责 MVCC，解决读一致性问题。

RU：读未提交，可脏读，一般不允许使用

RC：读已提交（read-committed），可以出现幻读，可以防止脏读，事务提交其它窗口立即生效能够查到。

RR：可重复读（默认，repeatable-read），防止幻读，利用 undo 快照 + GAP（间隙锁） + NextLock（下键锁）

SR：可串行读，可以防止死锁，但并发事务性能差。

测试当前事务隔离级别：

1. 开启事务，在两边查看：

另外一个窗口：

2. 更新这行数据：

另外一个窗口：

还是旧的数据！

3. 提交事务：

另外一个窗口：

依然是旧的数据！

4. 查看当前事务隔离级别：

select @@tx_isolation;

结果：

5. 如果想要读取到正确的，则只需要 commit 一次再读取，这是为了防止幻读：

也可以退出重新登录！这就是 RR 的可重复读的作用，同一窗口，数据始终一致。

其它说明：

在将隔离级别调整为 RC 之后，可以在 commit 之后其它窗口立即读取到最新的值，但是这也带来了程序的困扰，可能他还没有处理完这个请求你的值又变了。

为此，在 RC 模式中可以在语句中添加 for update，如：select * from city where id=100 for update; 这样就能锁住该行。直到我这边 commit 才解锁。

InnoDB 存储引擎优化参数

1. 查看默认存储引擎：

select @@default_storage_engine;

2. 查看和修改表的存储引擎：

-- 查看表的存储引擎
show create table city;
-- 修改表的存储引擎
alter table city engine="innodb";

一般在建表的时候就设置好，或者直接配置好默认的存储引擎。注意 MyISAM 不支持外键。

3. 查看共享表空间：

select @@innodb_data_file_path;

一般在初始化的时候配置，可以设置为：innodb_data_file_path=ibdata1:512M:ibdata2:512M:autoextend

4. 查看是否开启独立表空间：

show variables like "%innodb_file_per_table%";

5. 查看 buffer pool size：

show variables like "%innodb_buffer_pool_size%";

该值设置原则建议为内存的 75% - 80%。

show engine innodb status\G

也可以通过这样查看，不过这里的 Buffer pool size 显示的是数据页，一页等于 16K。

Free buffers 是空闲的，Database pages 是使用的，一般使用率 70% 左右就行了。

6. innodb_flush_log_at_trx_commit（双1标准之一）

show variables like "%flush_log%";

作用：控制 innodb 将 log buffer 中的数据写入日志文件并 flush 到磁盘的时间点，取值 0，1，2。

0：事务提交时，不做日志写入，而是每秒中将 log buffer 中的数据写入文件系统缓存并 fsync 磁盘一次。

1：每次事务提交都写入日志，flush 到磁盘，确保 ACID。

2：每次事务提交写入文件系统缓存，但是要每秒写入磁盘一次。

7. innodb_flush_method：

作用：控制 log buffer 和 data buffer 刷写磁盘时是否经过文件系统缓存。

show variables like "%innodb_flush%";

默认为 null。写到配置文件中生效。

fsync（默认）：日志和数据写磁盘，都走 OS buffer

O_DIRECT：数据写磁盘，不走 OS buffer

O_DSYN：日志写磁盘，不走 OS buffer

# 最高安全模式
innodb_flush_log_at_trx_commit=1
Innodb_flush_method=O_DIRECT

# 最高性能:
innodb_flush_log_at_trx_commit=0
Innodb_flush_method=fsync

8. redo log 配置：

# 设置 buffer 大小
innodb_log_buffer_size=16777216
# 设置 ib_logfile 的大小，可以稍微大些
innodb_log_file_size=50331648
# 设置  ib_logfile 个数
innodb_log_files_in_group=3

小结

本章节内容非常重要！

转载于:https://www.cnblogs.com/Dy1an/p/11393045.html

weixin_30247307

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【04】MySQL：存储引擎

写在前面的话在使用 Linux 的时候，可以经常听到有关文件系统 FS（File System）的东西，MySQL 也有属于自己类似的东西，那就是存储引擎。之前在创建数据表的时候，在 Create table 后面一般都加了 engine=innodb。这就是指定存储引擎。关于存储引擎可以将存储引擎就当作 Linux 而言的文件系统，其主要功能在于：数...
复制链接

扫一扫