工作日志0214：执行慢而大保证数据不丢失策略

最新推荐文章于 2024-06-17 13:56:54 发布

北堂飘霜

最新推荐文章于 2024-06-17 13:56:54 发布

阅读量60

点赞数

分类专栏：开发Bug 文章标签： java 开发语言

本文链接：https://blog.csdn.net/weixin_45487988/article/details/129028015

版权

开发Bug 专栏收录该内容

25 篇文章 1 订阅

订阅专栏

序言

最近需要做一个db to db的东西，总数据量三千万左右，我们需要将一个或者多个库中的表导出为Sql或者将一个或者多个sql文件导入到任意库。在这个过程中，我使用了多线程。（Python效率一言难尽）。那是必须要使用线程池的，但是执行一个sql文件或者导出如果耗时巨多，然后我们表又很多，会造成前面任务执行不完，后面任务有丢失的情况，所以我新定了一个策略，阻塞策略。意思就是如果有new Task ，那么线程池会等着处理完现在的任务再去处理他，再这过程中，不会有任务丢失。但是生产所带来的内存开销和资源交互开销是无法释放的（后面再谈解决方案）。

解决

重写RejectedExecutionHandler拒绝策略，代码如下：

/**
 * block the queue when it is full
 * @author Herche Jane
 */
public class BlockExecutionHandler implements RejectedExecutionHandler {
    @Override
    public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) {
        try {
            executor.getQueue().put(r);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

阻塞拒绝策略

结束语

虽然这个策略暂时缓和了燃眉之急，但是似乎引发了内存问题（待解决和寻找根源）。请谨慎使用！

北堂飘霜

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
工作日志0214：执行慢而大保证数据不丢失策略

最近需要做一个db to db的东西，总数据量三千万左右，我们需要将一个或者多个库中的表导出为Sql或者将一个或者多个sql文件导入到任意库。那是必须要使用线程池的，但是执行一个sql文件或者导出如果耗时巨多，然后我们表又很多，会造成前面任务执行不完，后面任务有丢失的情况，所以我新定了一个策略，阻塞策略。意思就是如果有new Task ，那么线程池会等着处理完现在的任务再去处理他，再这过程中，不会有任务丢失。虽然这个策略暂时缓和了燃眉之急，但是似乎引发了内存问题（待解决和寻找根源）。
复制链接

扫一扫