【咨询方案】mongo多线程请求问题

定时任务优化工作

需求

计算700个字段的分布结果,每个字段数据量百万起步 ,根据字段从mongon中提取数据 做数据集分布计算

存在的问题,

– mongodb查询耗时较多,(经测试,10个字段和一个字段的查询其实耗时差距不大,主要是数据返回导致内存oom)
– 字段多希望采用多线程并行执行数据集分布计算 (服务器8核 理论可以8个线程同时执行)
– 并发线程过多导致查询mongo并发多,会出现超时情况(mongo游标超时,默认10分钟)
– 多线程并行请求mongdb 字段超过30个时 内存oom (可能由于在计算过程中的数据集复制,导致数据膨胀)
– 之前测试结果 整体耗时1800s 计算耗时100s内,mongo查询耗时大

目前方案

线程池 5核心线程
mongo查询5个字段
测试耗时800s

解决的重点问题

– mongo并发查询请求问题,是否可以直接返回不采用游标方式?增加并发量
– 计算时对内存的管理,检查计算时内存的处理是否存在可优化的地方

请留下您的提议 !

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用Java多线程机制来实现MongoTemplate.bulkOps的多线程批量导入。 具体实现方式如下: 1. 创建一个MongoTemplate实例,用于访问MongoDB数据库。 2. 创建一个线程池,可以使用Java提供的ExecutorService来创建。推荐使用固定大小的线程池,可以根据系统资源和数据量来设置线程池的大小。 3. 将数据分成若干个批次,每个批次包含一定数量的数据。可以根据数据量和系统资源来确定每个批次的大小。 4. 对于每个批次,创建一个新的线程来执行bulkOps操作。在线程中,使用MongoTemplate.bulkOps.insert方法将数据插入到MongoDB中。 5. 执行完所有的线程后,关闭线程池和MongoTemplate实例。 下面是一个示例代码: ```java MongoTemplate mongoTemplate = ...; // 创建MongoTemplate实例 int batchSize = ...; // 每批次的数据量 List<YourDataModel> dataList = ...; // 待导入的数据列表 // 创建线程池 ExecutorService executorService = Executors.newFixedThreadPool(4); // 4为线程池大小 // 将数据分成若干个批次,每个批次包含batchSize条数据 List<List<YourDataModel>> batches = Lists.partition(dataList, batchSize); // 多线程批量导入数据 for (List<YourDataModel> batch : batches) { executorService.execute(() -> { BulkOperations bulkOps = mongoTemplate.bulkOps(BulkOperations.BulkMode.UNORDERED, YourDataModel.class); bulkOps.insert(batch); bulkOps.execute(); }); } // 关闭线程池和MongoTemplate实例 executorService.shutdown(); mongoTemplate.destroy(); ``` 需要注意的是,bulkOps操作是异步的,因此在使用bulkOps.insert方法时,应该保证在执行bulkOps.execute方法之前,所有的数据都已经插入到bulkOps中。可以在每个线程执行完bulkOps.insert方法后,调用bulkOps.execute方法来执行bulk操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值