数据分片,多线程处理

场景:mysql有100w条数据,要根据id更新到Elasticsearch。

处理方式:100w 条数据分页查询,每次查询1w条数据,再将这1w条数据分成10个分片,每个分片1000条数据,每个分片的1000数据由一条线程去执行处理,相当于10个分片由10个线程处理。

 

线程池工具类

/**
 * 线程池工具类
 */
public class ThreadUtil {
    /**
     * 线程池实例
     */
    private static ThreadPoolExecutor executor = null;
    /**
     * 核心线程数
     */
    private static final Integer THREADPOOL_COREPOOLSIZE = 30;
    /**
     * 最大线程数
     */
    private static final Integer THREADPOOL_MAXPOOLSIZE = 200;
    /**
     * 线程等待回收的存活时间,单位:分钟
     */
    private static final long THREADPOOL_KEEPALIVETIME = 10;

    /**
     * 初始化线程池
     * 线程池拒绝策略为默认的拒绝策略,如果不能加入工作队列就抛出RejectedExecutionException异常
     */
    static {

        executor = new ThreadPoolExecutor(THREADPOOL_COREPOOLSIZE,
                THREADPOOL_MAXPOOLSIZE,
                THREADPOOL_KEEPALIVETIME,
                TimeUnit.MINUTES,
                new ArrayBlockingQueue<>(80),
                new DefaultThreadFactory("defaultPool"),
                new ThreadPoolExecutor.AbortPolicy());
    }

    /**
     * 使用线程池运行任务,线程无返回值
     * @param task
     */
    public static void execute(Runnable task){
        executor.execute(task);
    }

    /**
     * 使用线程池提交异步任务,任务运行带返回值
     * @param task 实现了Callable接口的线程
     * @return
     */
    public static Future submit(Callable task){
        return executor.submit(task);
    }

    /**
     * 停止线程池
     */
    public static void shutdown() {
        executor.shutdown();
    }

    public static ThreadPoolExecutor getExecutor(){
        return executor;
    }
}

 

模拟测试数据

publi
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java分片多线程读取文件是一种常见的文件处理方式,它可以提高文件读取的效率。下面是一种实现方式: 1. 首先,确定要读取的文件路径和文件大小。 2. 根据文件大小和线程数,计算每个线程需要读取的文件分片大小。 3. 创建一个线程池,用于管理多个读取文件的线程。 4. 每个线程负责读取指定的文件分片,并将读取到的数据存储到内存中。 5. 等待所有线程完成读取操作。 6. 将每个线程读取到的数据进行合并,得到完整的文件内容。 以下是一个简单的示例代码: ```java import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; public class FileReadExample { private static final int THREAD_COUNT = 4; // 线程数 public static void main(String[] args) { String filePath = "path/to/file"; // 文件路径 File file = new File(filePath); long fileSize = file.length(); // 文件大小 long chunkSize = fileSize / THREAD_COUNT; // 每个线程读取的文件分片大小 ExecutorService executorService = Executors.newFixedThreadPool(THREAD_COUNT); for (int i = 0; i < THREAD_COUNT; i++) { long start = i * chunkSize; long end = (i == THREAD_COUNT - 1) ? fileSize : (i + 1) * chunkSize; executorService.execute(new FileReadTask(file, start, end)); } executorService.shutdown(); } static class FileReadTask implements Runnable { private File file; private long start; private long end; public FileReadTask(File file, long start, long end) { this.file = file; this.start = start; this.end = end; } @Override public void run() { try (FileInputStream fis = new FileInputStream(file)) { fis.skip(start); // 定位到指定的起始位置 byte[] buffer = new byte[(int) (end - start)]; fis.read(buffer); // 读取文件分片到内存中 // 处理读取到的数据,可以根据需求进行相应的操作 // ... } catch (IOException e) { e.printStackTrace(); } } } } ``` 这个示例代码中,我们通过创建一个线程池来管理多个读取文件的线程。每个线程负责读取指定的文件分片,并将读取到的数据存储到内存中。最后,我们可以根据需求对读取到的数据进行相应的处理

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值