MySQL优化案例篇1-mysqldump与load data比较篇

一.环境准备

一直想测试下mysqldump与load data的性能比较,今天抽出部分时间,在测试环境进行测试。

如下所示,我有一个测试表fact_sale,有7亿多行数据,数值类型、字符类型、时间类型的字段均有。

下面我们测试将这个表的数据分别通过mysqldump与load data进行导出,然后在目标环境进行导入。

mysql> select count(*) from fact_sale;
+-----------+
| count(*)  |
+-----------+
| 767830000 |
+-----------+
1 row in set (1 min 1.58 sec)

mysql> select * from fact_sale limit 10;
+----+---------------------+-----------+-----------+
| id | sale_date           | prod_name | sale_nums |
+----+---------------------+-----------+-----------+
|  1 | 2011-08-16 00:00:00 | PROD4     |        28 |
|  2 | 2011-11-06 00:00:00 | PROD6     |        19 |
|  3 | 2011-04-25 00:00:00 | PROD8     |        29 |
|  4 | 2011-09-12 00:00:00 | PROD2     |        88 |
|  5 | 2011-05-15 00:00:00 | PROD5     |        76 |
|  6 | 2011-02-23 00:00:00 | PROD6     |        64 |
|  7 | 2012-09-26 00:00:00 | PROD2     |        38 |
|  8 | 2012-02-14 00:00:00 | PROD6     |        45 |
|  9 | 2010-04-22 00:00:00 | PROD8     |        57 |
| 10 | 2010-10-31 00:00:00 | PROD5     |        65 |
+----+---------------------+-----------+-----------+
10 rows in set (0.01 sec)

mysql> desc fact_sale;
+-----------+--------------+------+-----+-------------------+-----------------------------------------------+
| Field     | Type         | Null | Key | Default           | Extra                                         |
+-----------+--------------+------+-----+-------------------+-----------------------------------------------+
| id        | bigint       | NO   | PRI | NULL              | auto_increment                                |
| sale_date | timestamp    | NO   |     | CURRENT_TIMESTAMP | DEFAULT_GENERATED on update CURRENT_TIMESTAMP |
| prod_name | varchar(200) | NO   |     | NULL              |                                               |
| sale_nums | int          | YES  |     | NULL              |                                               |
+-----------+--------------+------+-----+-------------------+-----------------------------------------------+
4 rows in set (0.01 sec)

mysql> 

二.数据迁移开始

2.1 mysqldump导出

命令:

mysqldump -uroot -p -hlocalhost test fact_sale> fact_sale_20210526.sql
scp ./fact_sale_20210526.sql root@10.31.1.124:/home/backup/

测试记录:

[root@10-31-1-122 backup]# mysqldump -uroot -p -hlocalhost test fact_sale> fact_sale_20210526.sql
Enter password: 
[root@10-31-1-122 backup]# 

scp ./fact_sale_20210526.sql root@10.31.1.124:/home/backup/

[root@10-31-1-122 mysql-files]# cd /home/backup/
[root@10-31-1-122 backup]# ls -lrth
总用量 33G
-rw-r--r-- 1 root root 33G 5月  26 11:34 fact_sale_20210526.sql

2.2 select … into outfile导出

命令:

select * from fact_sale into outfile "/var/lib/mysql-files/fact_sale_20210526.txt"; 
cd /var/lib/mysql-files/
ls -lrth
scp ./fact_sale_20210526.txt root@10.31.1.124:/home/backup/

测试记录:

mysql> select * from fact_sale into outfile "/var/lib/mysql-files/fact_sale_20210526.txt"; 
Query OK, 767830000 rows affected (12 min 31.91 sec)
[root@10-31-1-122 backup]# cd /var/lib/mysql-files/
[root@10-31-1-122 mysql-files]# ls -lrth
总用量 28G
-rw-rw-rw- 1 mysql mysql 28G 5月  26 11:52 fact_sale_20210526.txt

2.3 mysql 导入

考虑mysqldump没有输出时间,写了个简单的shell脚本,输出当前的时间。

代码:

[root@hp2 backup]# more 1.sh
date
echo "begin load data"
mysql -uroot -pabc123 test < fact_sale_20210526.sql
echo "end load data"
date

测试记录:

[root@hp2 backup]# sh 1.sh
2021年 05月 26日 星期三 13:58:36 CST
begin load data
mysql: [Warning] Using a password on the command line interface can be insecure.

end load data
2021年 05月 26日 星期三 16:03:12 CST

2.4 load data导入

load data之前需要先删除然后重新创建表

命令:

 CREATE TABLE `fact_sale` (
   `id` bigint NOT NULL AUTO_INCREMENT,
   `sale_date` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
   `prod_name` varchar(200) NOT NULL,
   `sale_nums` int DEFAULT NULL,
    PRIMARY KEY (`id`)
 ) ENGINE=InnoDB;

LOAD DATA INFILE '/home/backup/fact_sale_20210526.txt'  INTO TABLE fact_sale;

测试记录:

mysql> CREATE TABLE `fact_sale` (
    ->   `id` bigint NOT NULL AUTO_INCREMENT,
    ->   `sale_date` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
    ->   `prod_name` varchar(200) NOT NULL,
    ->   `sale_nums` int DEFAULT NULL,
    ->   PRIMARY KEY (`id`)
    -> ) ENGINE=InnoDB;
Query OK, 0 rows affected (0.01 sec)

mysql> LOAD DATA INFILE '/home/backup/fact_sale_20210526.txt'  INTO TABLE fact_sale;


Query OK, 767830000 rows affected (1 hour 34 min 50.20 sec)
Records: 767830000  Deleted: 0  Skipped: 0  Warnings: 0

2.5 总结

首先对比导出文件的大小
outfile的方式比mysqldump的导出的明显会小一些
其实这个很容易理解,outfile只包含数据,而mysqldump导出的是拼接的insert语句,所以容量会大一些。

[root@hp2 backup]# ls -lrth
总用量 60G
-rw-r--r--. 1 root root 33G 5月  26 11:50 fact_sale_20210526.sql
-rw-r--r--. 1 root root 28G 5月  26 13:52 fact_sale_20210526.txt
-rwxr--r--. 1 root root 106 5月  26 13:58 1.sh

然后对比导入的性能
mysql导入耗时2小时5分左右,而load data耗时1小时34分钟,load data的性能明显的优于mysql导入。

[root@hp2 backup]# sh 1.sh
2021年 05月 26日 星期三 13:58:36 CST
begin load data
mysql: [Warning] Using a password on the command line interface can be insecure.

end load data
2021年 05月 26日 星期三 16:03:12 CST

mysql> LOAD DATA INFILE '/home/backup/fact_sale_20210526.txt'  INTO TABLE fact_sale;


Query OK, 767830000 rows affected (1 hour 34 min 50.20 sec)
Records: 767830000  Deleted: 0  Skipped: 0  Warnings: 0

总结
mysqldump对于批量迁移数据便利性要高于outfile的方式。
如果是迁移大的日志表,可以考虑outfile的方式。

参考:

  1. https://blog.csdn.net/appleyuchi/article/details/106439710
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
mysql 数据库xscj1. 使用create user创建一个数据库用户student,密码是123456,该用户只能通过数据库本机访问数据库。2. 使用grant创建一个数据库用户teacher,密码是123456,该用户只能通过数据库本机访问数据库,并只能对teacher表进行查询、修改和新增。3. 使用grant给student用户赋予表student,score的查询权限。4. 使用revoke回收teacher用户的修改和新增teacher表的权限。5. 删除创建的数据库用户teacher。6. 使用 mysqldump备份数据库xscj中的所有表。7. 使用 mysqldump备份 xscj数据库中的teacher表。8. 使用mysqldump备份xscj和 mysql数据库。9. 使用mysqldump备份服务器中的所有数据库。10. 使用mysql命令将第6题的备份导入到xscj数据库中。11. 使用mysql命令用root用户登录到MySQL服务器,并使用source恢复第6题的备份。12. 使用 select.. into outfile将 xscj数据库中的 student表中的记录导出到文本。13. 使用 select .. into outfile将 xscj数据库中的 student表中的记录导出到文本文件,使用 fields选项,要求字段之间使用逗号“,”间隔,所有字段值用双引号括起来,定义转义字符定义为单引号“\’”,使用 lines选项,要求每行记录以字符串“>”开始,以“<end>”字符串结尾。14. 使用mysqldump将xscj数据库中的student中的记录导出到文本文件。15. 使用load data命令将13题导出的数据导入到xscj 数据库中的student表。
最新发布
06-02
1. 创建用户student并设置密码: ``` CREATE USER 'student'@'localhost' IDENTIFIED BY '123456'; ``` 2. 给用户teacher授权查询、修改和新增teacher表的权限: ``` GRANT SELECT, INSERT, UPDATE ON xscj.teacher TO 'teacher'@'localhost' IDENTIFIED BY '123456'; ``` 3. 给用户student授权查询表student和score的权限: ``` GRANT SELECT ON xscj.student TO 'student'@'localhost'; GRANT SELECT ON xscj.score TO 'student'@'localhost'; ``` 4. 回收用户teacher修改和新增teacher表的权限: ``` REVOKE INSERT, UPDATE ON xscj.teacher FROM 'teacher'@'localhost'; ``` 5. 删除用户teacher: ``` DROP USER 'teacher'@'localhost'; ``` 6. 备份数据库xscj中的所有表: ``` mysqldump -u username -p xscj > xscj.sql ``` 7. 备份xscj数据库中的teacher表: ``` mysqldump -u username -p xscj teacher > teacher.sql ``` 8. 备份xscj和mysql数据库: ``` mysqldump -u username -p --databases xscj mysql > xscj_mysql.sql ``` 9. 备份服务器中的所有数据库: ``` mysqldump -u username -p --all-databases > all_databases.sql ``` 10. 将第6题备份的数据导入到xscj数据库中: ``` mysql -u username -p xscj < xscj.sql ``` 11. 用root用户登录到MySQL服务器,并使用source恢复第6题备份: ``` mysql -u root -p Enter password: mysql> source /path/to/xscj.sql; ``` 12. 导出xscj数据库中的student表记录到文本: ``` SELECT * INTO OUTFILE '/path/to/student.txt' FROM xscj.student; ``` 13. 导出xscj数据库中的student表记录到文本文件,使用fields和lines选项: ``` SELECT * INTO OUTFILE '/path/to/student.csv' FIELDS TERMINATED BY ',' ENCLOSED BY '"' ESCAPED BY '\' LINES STARTING BY '>' TERMINATED BY '<end>' FROM xscj.student; ``` 14. 将xscj数据库中的student表中的记录导出到文本文件: ``` mysqldump -u username -p xscj student > student.sql ``` 15. 将第13题导出的数据导入到xscj数据库中的student表: ``` LOAD DATA INFILE '/path/to/student.csv' INTO TABLE xscj.student FIELDS TERMINATED BY ',' ENCLOSED BY '"' ESCAPED BY '\' LINES STARTING BY '>' TERMINATED BY '<end>'; ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值