巧用微服务进行大数据量计算

sunnyboy_4

已于 2022-12-10 16:44:55 修改

阅读量955

点赞数

CC 4.0 BY-SA版权

分类专栏： java 文章标签：大数据

于 2022-11-11 14:16:11 首次发布

本文链接：https://blog.csdn.net/u012228523/article/details/127803618

java 专栏收录该内容

13 篇文章

订阅专栏

本文探讨了如何解决大量班级数据（100万条）的统计需求，通过分页、线程池优化和微服务拆分，提升计算效率，以避免内存溢出问题。作者提供了Java实现和借鉴Spark的思路。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、问题说明：最近在做数据统计需求的时候遇到一个瓶颈
假如一个班级对应1000条数据，如果有1000个班级的话，对应100万条数据。需要批量查询并且计算。
2、第一种思路：
2.1、第一步：将1000个班级进行分页处理100个班级分成1页，那么就有10页
对应java代码

        List<Integer> classIds = new ArrayList<Integer>();
        for (int i = 0; i < 1000; i++) {
            classIds.add(i);
        }
        List<List<Integer>> partition = Lists.partition(classIds, 100);

2.2、第二步使用线程池的方式将数据在每个线程中处理然后建结果汇聚到主线程中在操作

		List<Integer> result = new ArrayList<>();
        partition.forEach(k -> {
            CompletableFuture<Integer> future = CompletableFuture.supplyAsync(() -> {
                //handlerData(k);在不同线程中执行统计结果计算
                //return data;
            }, asyncTaskExecutor).exceptionally(e -> {
                logger.error("当前线程{},异步执行失败", Thread.currentThread().getName(), e);
                throw new RuntimeException("失败");
            });
            try {
                result.add(future.get(20,TimeUnit.SECONDS));
            } catch (Exception e) {
                logger.error("当前线程{},异步执行失败", Thread.currentThread().getName(), e);
                throw new RuntimeException("失败");
            }
        });