Mysql5.7 单表 500万数据迁移到新表的快速实现方案

最新推荐文章于 2024-09-13 09:43:34 发布

小月施主

最新推荐文章于 2024-09-13 09:43:34 发布

阅读量8k

点赞数

分类专栏： Mysql 数据库文章标签： Mysql 数据迁移数据库

本文链接：https://blog.csdn.net/xiaocy66/article/details/83895941

版权

Mysql 同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

数据库

1 篇文章 0 订阅

订阅专栏

开发过程中需要把一个已有500万条记录的表数据同步到另一个新表中，刚好体验下Mysql官方推荐的大数据迁移的方案：SELECT INTO OUTFILE，LOAD DATA INFILE

Mysql 关于导出-导入文件的方式处理数据的官方文档地址：Mysql官方文档

本机配置：
Win7 64位系统
内存： 16G
处理器：Intel i5-4460  3.2GHz
Mysql 5.7

导出到txt的语法：

SELECT a,b,a+b INTO OUTFILE '/tmp/result.txt'
  FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  LINES TERMINATED BY '\n'
  FROM test_table;

首先把现有表数据导出到txt文件中：
SELECT * INTO OUTFILE 'test_9.txt' FIELDS TERMINATED BY ';' FROM f_item s WHERE s.status=1;

我们看到导出510W+的数据到txt，耗时53秒，导出的txt文件大小1.18G左右

导入的命令语法：

LOAD DATA INFILE Syntax

LOAD DATA [LOW_PRIORITY | CONCURRENT] [LOCAL] INFILE 'file_name'
    [REPLACE | IGNORE]
    INTO TABLE tbl_name
    [PARTITION (partition_name [, partition_name] ...)]
    [CHARACTER SET charset_name]
    [{FIELDS | COLUMNS}
        [TERMINATED BY 'string']
        [[OPTIONALLY] ENCLOSED BY 'char']
        [ESCAPED BY 'char']
    ]
    [LINES
        [STARTING BY 'string']
        [TERMINATED BY 'string']
    ]
    [IGNORE number {LINES | ROWS}]
    [(col_name_or_user_var
        [, col_name_or_user_var] ...)]
    [SET col_name={expr | DEFAULT},
        [, col_name={expr | DEFAULT}] ...]

然后新建一个表来转存储这些数据，使用LOAD DATA INFILE 的方式导入：
LOAD DATA INFILE 'fxxxx_9.txt' INTO TABLE fxxxxtest FIELDS TERMINATED BY ';' (id, info_id, field_id, element_id, TYPE, @a, @a, @a, @a, @a, VALUE, @a, @a, create_user_id, create_time, @a, @a, @a, @a);
我们看到导入总共510W+的数据，总共耗时6分51秒。

注意到上面导入的时候，过滤了一些字段，这些字段在导出的原始表中有，但是新表中不需要，所有通过这种声明字段列表的方式，以@的方式过滤掉对应的字段。

这里还有个小插曲：
在我这个需求中还不是单纯的转移数据，还需要把新表里面的新增的几个字段内容填充，依赖的是另外一个有150多万条记录的关联表里面的字段内容。我一开始是按照上面的方式迁移原始数据过去新表后，在SQLyog工具里面直接通过命令来同步的，类似以下命令：
update table_pre pt, table_union ut set pt.A1 = ut.A1, pt.A2=ut.A2 where pt.union_id=pt.id and pt.status=1;
结果就这个同步过程（table_pre表数据510万+，table_union数据150万+）总共耗时1个多小时…