Springboot 多线程分批切割处理 大数据量List集合 ,实用示例

本文介绍了在SpringBoot中处理大数据量List时如何通过异步并行处理提升效率。通过使用Lists.partition进行分片,然后利用ThreadPoolTaskExecutor配置线程池进行并行处理,以CompletableFuture实现任务的并发执行。文章还对比了并行处理与串行处理的性能差异,并提供了无需合流的异步执行示例。
摘要由CSDN通过智能技术生成

 
前言

哲学提问镇贴:


不了解异步怎么使用的看官, 可阅:

SpringBoot 最简单的使用异步线程案例 @Async_小目标青年的博客-CSDN博客

Springboot Async异步扩展使用 结合 CompletableFuture_小目标青年的博客-CSDN博客

想了解更多关于批量list处理操作的看官,可阅:
 

Java List数据量大, 需要分片批次操作_小目标青年的博客-CSDN博客

Mybatis 批量插入 采用分批处理一次500条_小目标青年的博客-CSDN博客

Springboot 手动分页查询,分批批量插入数据_小目标青年的博客-CSDN博客

正文

话不多说,本篇核心介绍的是日常毕竟常遇到的一些处理点。


首先list数据量大,需要切割操作 :

        

        //模拟拿到的数据量大的list
        List<Product> products = getBatchListTest();
        //直接用Lists.partition 按照100条一次切割
        List<List<Product>> allList = Lists.partition(products, 100);
        //循环分批处理切割的list
        for (List<Product> batchProducts :allList){
            productService.batchDealList(batchProducts);
        }
        


        
但是往往有时候 数据量是真大,切割完循环处理 还嫌慢

是的,因为循环处理是串行的, 也就是,比如500条数据的list,切割成5个 batchList。

如果每次处理一个barchList要1秒钟,那么循环串行处理5次,就是 1X5=5 秒。

所以我们分批切割这样串行处理完,觉得慢, 如果业务场景合适,我们可以试着改 并行 处理。

开袋及食:
 

① 配置一个线程池,交给spring管理的 线程池,用起来才放心、安心:

 ThreadConfig.java 

import java.util.concurrent.Executor;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.scheduling.annotation.EnableAsync;
import org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor;



@Configuration
@EnableAsync
public class ThreadConfig  {
    /**
     * 执行需要依赖线程池,这里就来配置一个线程池
     * @return
     */

    // 当池子大小小于corePoolSize,就新建线程,并处理请求
    // 当池子大小等于corePoolSize,把请求放入workQueue(QueueCapacity)中,池子里的空闲线程就去workQueue中取任务并处理
    // 当workQueue放不下任务时,就新建线程入池,并处理请求,如果池子大小撑到了maximumPoolSize,就用RejectedExecutionHandler来做拒绝处理
    // 当池子的线程数大于corePoolSize时,多余的线程会等待keepAliveTime长时间,如果无请求可处理就自行销毁

    @Bean("MyExecutor")
    public Executor getExecutor() {
        ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
        //设置核心线程数
        executor.setCorePoolSize(10);
        //设置最大线程数
        executor.setMaxPoolSize(100);
        //线程池所使用的缓冲队列
        executor.setQueueCapacity(250);
        //设置线程名
        executor.setThreadNamePrefix("JcTest-Async");
        //设置多余线程等待的时间,单位:秒
        //executor.setKeepAliveSeconds();
        // 初始化线程
        executor.initialize();
        return executor;
    }
}

 看看我们并行的写法:

 

    @Autowired
    ThreadConfig threadConfig;
    
    @PostMapping("doBatchParallelTes")
    public void doBatchParallelTes() {
        List<Product> products = getBatchListTest();
        List<List<Product>> allList = Lists.partition(products, 100);
        int batchNum = allList.size();
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Executor threadConfigExecutor = threadConfig.getExecutor();
        List<CompletableFuture> results = new ArrayList<>();
        for (List<Product> batchProducts :allList){
            CompletableFuture<String> future = CompletableFuture.supplyAsync(() -> {
                productService.batchDealList(batchProducts);
                return "";
            }, threadConfigExecutor);
            results.add(future);
        }
        CompletableFuture.allOf(results.toArray(results.toArray(new CompletableFuture[batchNum]))).join();
        stopWatch.stop();
        System.out.println("总用时"+stopWatch.getTotalTimeMillis()+"毫秒");
    }

代码简析:

并行图解:

 看看执行效果:

 
那么看到这里,大家一定注意到了那个 ‘合流’ , 是不是每个业务都需要这样所谓的‘合流’?

当然不是,如果说这批list处理完完事了,不需要考虑回到主线程去做其余操作,那么我们就不需要‘合流’操作。

不需要合流,主线程走主线程逻辑,子线程自己玩自己的:

    @PostMapping("doBatchTestNew2")
    public void doBatchTestNew2() {
        List<Product> products = getBatchListTest();
        List<List<Product>> allList = Lists.partition(products, 100);
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        Executor threadConfigExecutor = threadConfig.getExecutor();
        for (List<Product> batchProducts :allList){
         CompletableFuture.runAsync(() -> {
                productService.batchDealList(batchProducts);
         }, threadConfigExecutor);
        }
        stopWatch.stop();
        System.out.println("总用时"+stopWatch.getTotalTimeMillis()+"毫秒");
    }

效果,其实就是异步执行: 

那如果说是基于@Async 的方式去实现呢,当然也是可以的,示例:

 基于@Async 就不多说了,这个在文章开头有介绍相关文章,之前写的,介绍过玩法,就是这两篇:

SpringBoot 最简单的使用异步线程案例 @Async_小目标青年的博客-CSDN博客

Springboot Async异步扩展使用 结合 CompletableFuture_小目标青年的博客-CSDN博客

好了,该篇就到这。

  • 11
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
### 回答1: Spring Boot可以使用Java多线程处理List。具体步骤如下: 1. 创建一个线程池,可以使用Java自带的线程池或者使用第三方库,如Apache的Commons Pool。 2. 将List分割成多个子List,每个子List包含一定数的元素。 3. 创建多个线程,每个线程处理一个子List中的元素。 4. 将处理结果合并成一个List。 下面是一个简单的示例代码: ```java @Service public class MyService { @Autowired private ExecutorService executorService; public List<String> processList(List<String> list) throws InterruptedException, ExecutionException { List<List<String>> subLists = splitList(list, 10); // 将List分割成每个子List包含10个元素 List<Future<List<String>>> futures = new ArrayList<>(); for (List<String> subList : subLists) { Future<List<String>> future = executorService.submit(() -> { List<String> result = new ArrayList<>(); for (String str : subList) { // 处理每个元素 result.add(str.toUpperCase()); } return result; }); futures.add(future); } List<String> result = new ArrayList<>(); for (Future<List<String>> future : futures) { result.addAll(future.get()); // 将每个子List处理结果合并成一个List } return result; } private List<List<String>> splitList(List<String> list, int size) { List<List<String>> subLists = new ArrayList<>(); for (int i = ; i < list.size(); i += size) { subLists.add(list.subList(i, Math.min(i + size, list.size()))); } return subLists; } } ``` 在上面的示例代码中,我们使用了Java自带的线程池,并将List分割成每个子List包含10个元素。然后,我们创建多个线程,每个线程处理一个子List中的元素,并将处理结果合并成一个List。最后,我们返回合并后的List。 ### 回答2: 在Spring Boot应用程序中,处理具有大数据的列表是很常见的情况。如果我们只使用单线程来处理这些数据,那么我们可能会遇到性能瓶颈问题。为了解决这个问题,我们可以使用多线程技术来并行处理数据,从而提高处理数据的效率。 在Spring Boot中,我们可以使用Java多线程库来处理列表。具体来说,我们可以使用Java的Executor框架,通过创建线程池、提交任务、执行任务等方式来实现多线程处理列表,其中: 1. 创建线程池:我们可以通过Executors.newFixedThreadPool()方法来创建一个具有固定数线程的线程池,并且该线程池的大小是可以配置的。 2. 提交任务:我们可以将我们要处理的列表拆分成若干个小块,然后将每个小块封装成一个任务,再通过线程池的submit()方法来提交任务。 3. 执行任务:线程池会从任务队列中选择一个任务,并且会将任务分配给线程池中的一个空闲线程来执行。执行完毕后,线程会返回结果,并且任务会从任务队列中删除。 需要注意的是,在使用多线程处理列表时,我们要在任务之间进行合理的划分,以确保每个任务的处理时间相对均衡。如果某些任务的处理时间过长,那么就会拖慢整个处理过程的速度。因此,我们可以考虑将任务分成若干个块,并且每个块都拥有相似的大小,从而确保任务的处理时间相对平衡。 另外,在使用多线程处理列表时,我们还需要注意数据的同步问题。如果多个线程同时修改同一个列表,那么就很容易出现数据竞争问题。因此,我们要使用同步机制来确保多个线程之间的数据同步。例如,在Java中,我们可以使用ConcurrentHashMap集合来实现线程安全的数据同步。 总之,使用多线程技术处理列表可以提高我们应用程序的效率,但是在实现这一过程中需要注意并发问题。 ### 回答3: 在使用Spring Boot进行开发时,涉及到多线程处理List的情况是非常常见的。可以通过使用Java多线程技术来提高程序的并发处理能力,从而提高程序的性能和效率。以下是关于Spring Boot多线程处理List的一些建议。 1.使用Java的Executor框架 Executor框架是Java提供的多线程处理的原生框架,其提供了线程池等多种线程处理功能。通过使用Executor框架,可以实现对List进行并行处理,从而提高程序的效率。 2.使用Java的并行流 Java 8引入了Stream API,其中的并行流可以非常方便地对集合进行并行处理。通过使用并行流,可以轻松地将List分成多个部分进行并行处理,从而大大提高程序的效率。 3.使用分块技术 在处理大型List时,通常使用分块技术可以最大程度地发挥多线程的优势。将List分成多个部分,每个部分分配一个线程来处理,最终将结果合并即可。 4.使用线程安全的集合多线程环境下,使用线程安全的集合是非常重要的。否则,当多个线程同时读写同一个List时,容易造成数据的不一致性和线程安全问题。Spring Boot提供了许多线程安全的集合,如ConcurrentHashMap等。 以上是关于Spring Boot多线程处理List的一些建议。通过合理地选择多线程处理方法和使用线程安全的集合,可以有效提高程序的性能和效率。同时,在进行多线程处理时,还需要注意线程安全和数据一致性等问题,以确保程序的正确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小目标青年

对你有帮助的话,谢谢你的打赏。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值