多线程+List分段处理批量数据

文章介绍了在处理大量数据时,如何通过拆分集合并使用多线程来提升批量操作的效率。首先将大集合拆分成小集合,然后创建线程池进行异步执行,最后通过CountDownLatch同步控制,确保所有任务完成后再进行下一步操作。这种方法能有效提高大数据量处理的性能。
摘要由CSDN通过智能技术生成

不少开发者在遇到项目对数据进行批量操作的时候,都会有不少的烦恼,尤其是针对数据量极大的情况下,效率问题就直接提上了菜板。

因此,开多线程来执行批量任务是十分重要的一种批量操作思路,其实这种思路实现起来也十分简单,如下图:
在这里插入图片描述
步骤:
1.获取需要进行批量更新的大集合A,对大集合进行拆分操作,分成N个小集合A-1 ~ A-N 。

2.开启线程池,针对集合的大小进行调参,对小集合进行批量更新操作。

3.对流程进行控制,控制线程执行顺序。

按照指定大小拆分集合的工具类

import com.google.common.collect.Lists;
import org.apache.commons.collections.CollectionUtils;

import java.util.List;

/**
 * 拆分结合工具类
 *
 * @author shiwen
 */
public class SplitListUtils 

    /**
     * 拆分集合
     *
     * @param <T> 泛型对象
     * @param resList 需要拆分的集合
     * @param subListLength 每个子集合的元素个数
     * @return 返回拆分后的各个集合组成的列表
     * 代码里面用到了guava和common的结合工具类
     **/
    public static <T> List<List<T>> split(List<T> resList, int subListLength) 
        if (CollectionUtils.isEmpty(resList) || subListLength <= 0) 
            return Lists.newArrayList();
        
        List<List<T>> ret = Lists.newArrayList();
        int size = resList.size();
        if (size <= subListLength) 
            // 数据量不足 subListLength 指定的大小
            ret.add(resList);
         else 
            int pre = size / subListLength;
            int last = size % subListLength;
            // 前面pre个集合,每个大小都是 subListLength 个元素
            for (int i = 0; i < pre; i++) 
                List<T> itemList = Lists.newArrayList();
                for (int j = 0; j < subListLength; j++) 
                    itemList.add(resList.get(i * subListLength + j));
                
                ret.add(itemList);
            
            // last的进行处理
            if (last > 0) 
                List<T> itemList = Lists.newArrayList();
                for (int i = 0; i < last; i++) 
                    itemList.add(resList.get(pre * subListLength + i));
                
                ret.add(itemList);
            
        
        return ret;
    

    // 运行代码
    public static void main(String[] args) 
        List<String> list = Lists.newArrayList();
        int size = 1099;
        for (int i = 0; i < size; i++) 
            list.add("hello-" + i);
        
        // 大集合里面包含多个小集合
        List<List<String>> temps = split(list, 100);
        int j = 0;
        // 对大集合里面的每一个小集合进行操作
        for (List<String> obj : temps) 
            System.out.println(String.format("row:%s -> size:%s,data:%s", ++j, obj.size(), obj));
        
    

创建线程池,异步执行

public void threadMethod() 
    List<T> updateList = new ArrayList();
    // 初始化线程池, 参数一定要一定要一定要调好!!!!
    ThreadPoolExecutor threadPool = new ThreadPoolExecutor(20, 50,
            4, TimeUnit.SECONDS, new ArrayBlockingQueue(10), new ThreadPoolExecutor.AbortPolicy());
    // 大集合拆分成N个小集合, 这里集合的size可以稍微小一些(这里我用100刚刚好), 以保证多线程异步执行, 过大容易回到单线程
    List<T> splitNList = SplitListUtils.split(totalList, 100);
    // 记录单个任务的执行次数
    CountDownLatch countDownLatch = new CountDownLatch(splitNList.size());
    // 对拆分的集合进行批量处理, 先拆分的集合, 再多线程执行
    for (List<T> singleList : splitNList) 
        // 线程池执行
        threadPool.execute(new Thread(new Runnable()
            @Override
            public void run() 
                for (Entity yangshiwen : singleList) 
                    // 将每一个对象进行数据封装, 并添加到一个用于存储更新数据的list
                    // ......
                    
                
            
        ));
        // 任务个数 - 1, 直至为0时唤醒await()
        countDownLatch.countDown();
    
    try 
        // 让当前线程处于阻塞状态,直到锁存器计数为零
        countDownLatch.await();
     catch (InterruptedException e) 
        throw new BusinessLogException(ResponseEnum.FAIL);
    
    // 通过mybatis的批量插入的方式来进行数据的插入, 这一步还是要做判空
    if (GeneralUtil.listNotNull(updateList)) 
        batchUpdateEntity(updateList);
        LogUtil.info("xxxxxxxxxxxxxxx");
  • 4
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值