mysql大表不停机加字段_mysql大表在不停机的情况下增加字段该怎么处理

最新推荐文章于 2024-07-28 02:52:46 发布

坐会儿吧

最新推荐文章于 2024-07-28 02:52:46 发布

阅读量533

点赞数

文章标签： mysql大表不停机加字段

本文链接：https://blog.csdn.net/weixin_34150870/article/details/113949008

版权

本文介绍了在MySQL中如何在不停机的情况下为大表添加字段。通过三种场景演示，包括直接添加字段（适合系统不繁忙或ONLINE DDL条件）、使用pt-osc工具在线添加（适用于大表且希望减少影响）以及先在从库添加再进行主从切换（针对热表）。详细解释了每种方法的适用情况和操作步骤。

摘要由CSDN通过智能技术生成

MySQL中给一张千万甚至更大量级的表添加字段一直是比较头疼的问题，遇到此情况通常该如果处理？本文通过常见的三种场景进行案例说明。

1、环境准备

数据库版本： 5.7.25-28(Percona 分支)

服务器配置： 3台centos 7虚拟机，配置均为2CPU 2G内存

数据库架构： 1主2从的MHA架构(为了方便主从切换场景的演示，如开启GTID，则两节点即可)，关于MHA搭建可参考此文 MySQL高可用之MHA集群部署

准备测试表：创建一张2kw记录的表，快速创建的方法可以参考快速创建连续数

本次对存储过程稍作修改，多添加几个字段，存储过程如下：

DELIMITER $$CREATE PROCEDURE `sp_createNum`(cnt INT)BEGIN

DECLARE i INT DEFAULT 1;DROP TABLE if existstb_add_columns;CREATE TABLE if not exists tb_add_columns(id int primary key,col1 int,col2 varchar(32));INSERT INTO tb_add_columns(id,col1,col2) SELECT i as id ,i%7 as col1,md5(i) ascol2;WHILE i

INSERT INTO tb_add_columns(id,col1,col2) SELECT id + i as id ,( id + i) %7 as col1,md5( id + i) as col2 FROM tb_add_columns WHERE id <=cnt -i ;SET i = i*2;END;END WHILE;END$$

DELIMITER ;

调用存储过程，完成测试表及测试数据的创建。

mysql> call sp_createNum(20000000);

2. 直接添加字段

使用场景: 在系统不繁忙或者该表访问不多的情况下，如符合ONLINE DDL的情况下，可以直接添加。

模拟场景：创建一个测试脚本，每10s访问该表随机一条记录，然后给该表添加字段

访问脚本如下：

#!/bin/bash

# gjcfor i in {1..1000000000} # 访问次数1000000000，按需调整即可do

id=$RANDOM #生成随机数

mysql-uroot -p'123456' --socket=/data/mysql3306/tmp/mysql.sock -e "select a.*,now() from testdb.tb_add_columns a where id ="$id# 访问数据sleep 10# 暂停10sdone

运行脚本

sh test.sh

给表添加字段

mysql> alter table testdb.tb_add_columns add col3 int;

此时，访问正常。

附ONLINE DDL的场景如下，建议DBA们必须弄清楚

(图片转载于https://blog.csdn.net/finalkof1983/article/details/88355314)

3. 使用工具在线添加

虽然Online DDL添加字段时，表依旧可以读写，但是生产环境使用场景中对大表操作使用最多的还是使用工具pt-osc或gh-ost添加。

本文主要介绍 pt-osc(pt-online-schema-change) 来添加字段，该命令是Percona Toolkit工具中的使用频率最高的一种

关于Percona Toolkit的安装及主要使用可以参考五分钟学会Percona Toolkit 安装及使用

添加字段

root@mha1 ~]# pt-online-schema-change --alter "ADD COLUMN col4 int" h=localhost,P=3306,p=123456,u=root,D=testdb,t=tb_add_columns,S=/data/mysql3306/tmp/mysql.sock --charset=utf8mb4 --execute

主要过程如下：

1> Cannot connect to A=utf8mb4,P=3306,S=/data/mysql3306/tmp/mysql.sock,h=192.168.28.132,p=...,u=root1> Cannot connect to A=utf8mb4,P=3306,S=/data/mysql3306/tmp/mysql.sock,h=192.168.28.131,p=...,u=root

No slaves found. See--recursion-method ifhost mha1 has slaves. # 因为使用的是socket方式连接数据库且未配置root远程连接账号，所以会有此提示

# A software update is available:

Operation, tries,wait:

analyze_table,10, 1copy_rows,10, 0.25create_triggers,10, 1drop_triggers,10, 1swap_tables,10, 1update_foreign_keys,10, 1Altering `testdb`.`tb_add_columns`...

Creating new table... # 创建中间表，表名为"_原表名_new"

Created new table testdb._tb_add_columns_new OK.

Altering new table... # 修改表，也就是在新表上添加字段，因新表无数据，因此很快加完

Altered `testdb`.`_tb_add_columns_new` OK.2020-06-20T12:23:43Creating triggers... # 创建触发器，用于在原表拷贝到新表的过程中原表有数据的变动(新增、修改、删除)时，也会自动同步至新表中2020-06-20T12:23:43Created triggers OK.2020-06-20T12:23:43 Copying approximately 19920500rows... # 拷贝数据，数据库量是统计信息里的，不准确

Copying `testdb`.`tb_add_columns`:11% 03:50remain # 分批拷贝数据(根据表的size切分每批拷贝多少数据)，拷贝过程中可以用show processlist看到对应的sql

Copying `testdb`.`tb_add_columns`:22% 03:22remain

Copying `testdb`.`tb_add_columns`:32% 03:10remain

Copying `testdb`.`tb_add_columns`:42% 02:45remain

Copying `testdb`.`tb_add_columns`:51% 02:21remain

Copying `testdb`.`tb_add_columns`:62% 01:48remain

Copying `testdb`.`tb_add_columns`:72% 01:21remain

Copying `testdb`.`tb_add_columns`:81% 00:53remain

Copying `testdb`.`tb_add_columns`:91% 00:24remain2020-06-20T12:28:40Copied rows OK. # 拷贝数据完成2020-06-20T12:28:40Analyzing new table... # 优化新表2020-06-20T12:28:40Swapping tables... # 交换表名，将原表改为"_原表名_old",然后把新表表名改为原表名2020-06-20T12:28:41Swapped original and new tables OK.2020-06-20T12:28:41Dropping old table... # 删除旧表(也可以添加参数不删除旧表)2020-06-20T12:28:41Dropped old table `testdb`.`_tb_add_columns_old` OK.2020-06-20T12:28:41Dropping triggers... # 删除触发器2020-06-20T12:28:41Dropped triggers OK.

Successfully altered `testdb`.`tb_add_columns`. # 完成

修改过程中，读写均不受影响，大家可以写个程序包含读写的

注：无论是直接添加字段还是用pt-osc添加字段，首先都得拿到该表的元数据锁，然后才能添加(包括pt-osc在创建触发器和最后交换表名时都涉及)，因此，如果一张表是热表，读写特别频繁或者添加时被其他会话占用，则无法添加。

例如：锁住一条记录

用pt-osc添加字段，会发现一直卡在创建触发器那一步

此时查看对应的SQL正在等待获取元数据锁

换成直接添加也一样，例如

当达到锁等待后将会报错放弃添加字段

mysql> alter table testdb.tb_add_columns add col5 int;

ERROR1205 (HY000): Lock wait timeout exceeded; try restarting transaction

对于此情况，需等待系统不繁忙情况下添加，或者使用后续的在从库创建再进行主从切换

4 先在从库修改，再进行主从切换

使用场景：如果遇到上例中一张表数据量大且是热表(读写特别频繁)，则可以考虑先在从库添加，再进行主从切换，切换后再将其他几个节点上添加字段。

先在从库添加(本文在备选节点添加)

mysql> alter table testdb.tb_add_columns add col5 int;

Query OK,0 rows affected (1 min 1.91sec)

Records:0 Duplicates: 0 Warnings: 0

进行主从切换

使用MHA脚本进行在线切换

masterha_master_switch --conf=/etc/masterha/app1.conf --master_state=alive --orig_master_is_new_slave --new_master_host=192.168.28.131 --new_master_port=3306

切换完成后再对其他节点添加字段

/*原主库上添加192.168.28.128*/mysql> alter table testdb.tb_add_columns add col5 int;

Query OK,0 rows affected (1 min 8.36sec)

Records:0 Duplicates: 0 Warnings: 0

/*另一个从库上添加192.168.28.132*/mysql> alter table testdb.tb_add_columns add col5 int;

Query OK,0 rows affected (1 min 8.64sec)

Records:0 Duplicates: 0 Warnings: 0

这样就完成了字段添加。

5. 小结

生产环境MySQL添加或修改字段主要通过如下三种方式进行，实际使用中还有很多注意事项，大家要多多总结。

直接添加

如果该表读写不频繁，数据量较小(通常1G以内或百万以内)，直接添加即可(可以了解一下online ddl的知识)