Mysql海量数据迁移

本文探讨了在面临百万、千万级别数据量的MySQL表迁移时,三种不同的解决方案:limit方式、索引方式和ResultSet方式。limit方式简单但效率低下;索引方式通过ID区间提高效率,但存在全表扫描和空查询问题;ResultSet方式采用流式获取数据,效率高且避免OOM风险,但失败后需从头开始。总结推荐使用ResultSet的流式方法进行数据迁移。
摘要由CSDN通过智能技术生成

问题

项目中遇到对表数据全量迁移,表数据量比较大,基本上是在百万、千万级别。

方案

limit方式

首先最开始的方案就是简单粗暴最直接的Limit查询,这种方案对少量数据是可行的,但是到后面数据量大的时候
再进行limit x,y 这个时候效率会很低,会执行全表扫描,例如

select * from table limit 150000,1000;
  • 优点

    • 实现逻辑简单
  • 缺点

    • limit数据量大的时候效率低

索引方式

此方式是直接获取的满足条件的最小和最大ID(主键),然后通过ID区间的批量BETWEEN AND方式来获取数据

  • 优点

    • 每次查询都是通过索引ID来获取数据,执行效率高
  • 缺点

    • 在获取min(id)和max(id)会执行全表扫描,比较慢
    • id段不连续,会出现不符合条件的空查询
    public File getData() {
        long min = x;
        long max = y;
        if (min == 0 || max == 0) {
            return null;
        }
        long size = max - min + 1;
        int batchNum = 5000;
        int pageNum = size % batchNum == 0 ? (int) (size / batchNum) : (int) (size / batchNum) + 1;

        ExecutorService es = Executors.newFixedThreadPool(5);
        Future<Boolean>[] result = new Future[pageNum];

        for (
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值