springboot中多线程批量处理数据

最新推荐文章于 2024-04-22 15:18:53 发布

高级盘丝洞

最新推荐文章于 2024-04-22 15:18:53 发布

阅读量2.7k

点赞数 1

文章标签： java 开发语言后端

原文链接：https://blog.csdn.net/lw1124052197/article/details/81980272

版权

1.配置文件

配置线程池参数

book:
  core:
    poolsize: 100
  max:
    poolsize: 200
  queue:
    capacity: 200
  keepAlive:
    seconds: 30
  thread:
    name:
      prefix: zzzzz

线程池配置类

package com.example.demo.config;

import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.scheduling.annotation.EnableAsync;
import org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor;

import java.util.concurrent.ThreadPoolExecutor;

@Configuration
@EnableAsync
public class AsyncConfig {

	//接收报文核心线程数
	@Value("${book.core.poolsize}")
	private int bookCorePoolSize;
	//接收报文最大线程数
	@Value("${book.max.poolsize}")
	private int bookMaxPoolSize;
	//接收报文队列容量
	@Value("${book.queue.capacity}")
	private int bookQueueCapacity;
	//接收报文线程活跃时间（秒）
	@Value("${book.keepAlive.seconds}")
	private int bookKeepAliveSeconds;
	//接收报文默认线程名称
	@Value("${book.thread.name.prefix}")
	private String bookThreadNamePrefix;

	/**
	 * bookTaskExecutor:(接口的线程池). <br/>
	 *
	 * @return TaskExecutor taskExecutor接口
	 * @since JDK 1.8
	 */
	@Bean(name = "BookTask")
	public ThreadPoolTaskExecutor bookTaskExecutor() {
		//newFixedThreadPool
		ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
		// 设置核心线程数
		executor.setCorePoolSize(bookCorePoolSize);
		// 设置最大线程数
		executor.setMaxPoolSize(bookMaxPoolSize);
		// 设置队列容量
		executor.setQueueCapacity(bookQueueCapacity);
		// 设置线程活跃时间（秒）
		executor.setKeepAliveSeconds(bookKeepAliveSeconds);
		// 设置默认线程名称
		executor.setThreadNamePrefix(bookThreadNamePrefix);
		// 设置拒绝策略
		// rejection-policy：当pool已经达到max size的时候，如何处理新任务
		// CALLER_RUNS：不在新线程中执行任务，而是由调用者所在的线程来执行
		executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy());
		// 等待所有任务结束后再关闭线程池
		executor.setWaitForTasksToCompleteOnShutdown(true);
		executor.initialize();
		return executor;
	}
}

异步处理

package com.example.demo.config;

import com.example.demo.dao.UserDao;
import com.example.demo.entity.UserDomain;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.scheduling.annotation.Async;
import org.springframework.scheduling.annotation.AsyncResult;
import org.springframework.stereotype.Component;

import java.util.List;
import java.util.concurrent.Future;

@Component
public class SyncBookHandler {


	@Autowired
	private UserDao userDao;

	private static final Logger LOG = LoggerFactory.getLogger(SyncBookHandler.class);

	/**
	 * syncMargePsr:(多线程同步处理数据方法). <br/>
	 *
	 * @param bookList  一段数据集合
	 * @param pageIndex 段数
	 * @return Future<String> future对象
	 * @author LW
	 * @since JDK 1.8
	 */
	@Async(value = "BookTask")
	public Future <String> syncMargePsr(List <UserDomain> bookList, int pageIndex) {

		System.out.println("thread name " + Thread.currentThread().getName());
		LOG.info(String.format("此批数据的段数为:%s 此段数据的数据条数为:%s", pageIndex, bookList.size()));
		//声明future对象
		Future <String> result = new AsyncResult <String>("");
		//循环遍历该段旅客集合
		if (null != bookList && bookList.size() > 0) {
			for (UserDomain book : bookList) {
				try {
					//数据入库操作
					userDao.insert(book);
				} catch (Exception e) {

					//记录出现异常的时间，线程name
					result = new AsyncResult <String>("fail,time=" + System.currentTimeMillis() + ",thread id=" + Thread.currentThread().getName() + ",pageIndex=" + pageIndex);
					continue;
				}
			}
		}
		return result;
	}
}

测试数据方法

 public List <UserDomain> getPsrList() {
        List <UserDomain> psrList = new ArrayList <UserDomain>();
        for (int i = 0; i < 400000; i++) {
            UserDomain book = new UserDomain();
            book.setUserName("zcl" + i);
            psrList.add(book);
        }
        return psrList;

    }

切割数据

public void receiveBookJobRun() {
        List <UserDomain> bookList = null;


        bookList = getPsrList();
        //入库开始时间
        Long inserOrUpdateBegin = System.currentTimeMillis();
        log.info("数据更新开始时间:" + inserOrUpdateBegin);
        //接收集合各段的 执行的返回结果
        List <Future <String>> futureList = new ArrayList <Future <String>>();
        //集合总条数
        if (bookList != null) {
            int listSize = bookList.size();

            int listStart, listEnd;
            //当总条数不足threadSum条时 用总条数 当做线程切分值
            if (threadSum > listSize) {
                threadSum = listSize;
            }

            //将list 切分多份 多线程执行
            for (int i = 0; i < threadSum; i++) {
                //计算切割  开始和结束
                listStart = listSize / threadSum * i;
                listEnd = listSize / threadSum * (i + 1);
                //最后一段线程会 出现与其他线程不等的情况
                if (i == threadSum - 1) {
                    listEnd = listSize;
                }
                //数据切断
                List <UserDomain> sunList = bookList.subList(listStart, listEnd);

                //每段数据集合并行入库
                futureList.add(syncBookHandler.syncMargePsr(sunList, i));

            }

            //对各个线程段结果进行解析
            for (Future <String> future : futureList) {

                String str;
                if (null != future) {
                    try {
                        str = future.get().toString();
                        log.info("current thread id =" + Thread.currentThread().getName() + ",result=" + str);

                    } catch (InterruptedException | ExecutionException e) {

                        log.info("线程运行异常！");
                    }

                } else {
                    log.info("线程运行异常！");
                }

            }
        }


        Long inserOrUpdateEnd = System.currentTimeMillis();
        log.info("数据更新结束时间:" + inserOrUpdateEnd + "。此次更新数据花费时间为：" + (inserOrUpdateEnd - inserOrUpdateBegin));
    }

结果

2020-06-07 17:08:28.167  INFO 11976 --- [         zzzzz1] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:0 此段数据的数据条数为:4000
2020-06-07 17:08:28.167  INFO 11976 --- [        zzzzz2] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:1 此段数据的数据条数为:4000
2020-06-07 17:08:28.167  INFO 11976 --- [        zzzzz3] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:2 此段数据的数据条数为:4000
thread name zzzzz55
2020-06-07 17:08:28.167  INFO 11976 --- [        zzzzz4] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:3 此段数据的数据条数为:4000
thread name zzzzz48
thread name zzzzz46
2020-06-07 17:08:28.168  INFO 11976 --- [        zzzzz5] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:4 此段数据的数据条数为:4000
2020-06-07 17:08:28.168  INFO 11976 --- [        zzzzz6] com.example.demo.config.SyncBookHandler  : 此批数据的段数为:5 此段数据的数据条数为:666

总结

通过以上测试案列，同样是导入百万条数据，多线程耗时1.67分钟，单线程耗时5.75分钟。通过对不同线程数的测试，发现不是线程数越多越好，具体多少合适，网上有一个不成文的算法：
CPU核心数量*2 +2 个线程。

高级盘丝洞

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
springboot中多线程批量处理数据

1.配置文件配置线程池参数book: core: poolsize: 100 max: poolsize: 200 queue: capacity: 200 keepAlive: seconds: 30 thread: name: prefix: zzzzz线程池配置类package com.example.demo.config;import org.springframework.beans.factory
复制链接

扫一扫