Java中大数据多线程导入MySQL性能测试

业务

多线程可以有效地提高业务效率,下面模拟向MySQL分批次写入100万条记录,看看使用多线程和不使用多线程,耗费时间的差距

注:本次实验是往本地MySQL数据库写入数据,如果是服务器的数据库,一般来说网络速度会成为瓶颈

配置

CPU 4核8线程

在这里插入图片描述

内存 16G 2400MHz

在这里插入图片描述

测试代码

使用MyBatis向MySQL数据插入数据,线程池初始大小20,分10轮写入,每轮写入10万条数据,总计100万,由于MyBatis无法承载太多数据,所以每轮10万条数据分200批次写入MySQL数据库,每批次500条记录

package com.example.mysql.controller;

import com.example.mysql.entity.User;
import com.example.mysql.mapper.UserMapper;
import com.example.mysql.util.DateUtil;
import com.example.mysql.util.NumberUtil;
import com.example.mysql.util.UUIDUtil;
import com.example.mysql.util.id.IdGenerator;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.collections4.ListUtils;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;

import javax.annotation.Resource;
import java.text.ParseException;
import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.atomic.AtomicInteger;

@RestController
@Slf4j
public class MySqlIndexControllerThreadPool {

    @Resource
    private UserMapper userMapper;

    private final ExecutorService executorService = Executors.newFixedThreadPool(20);

    @GetMapping("/mysql/thread/pool")
    public String mysql() throws ParseException {

        long st = System.currentTimeMillis();

        int total = 0;

        for (int i = 0; i < 10; i++) {

            List<User> users = new ArrayList<>();

            for (int j = 0; j < 100000; j++) {
                User user = new User();
                user.setId(IdGenerator.nextCommonId());
                user.setUsername(UUIDUtil.nextUUID().substring(0,10));
                user.setPassword(UUIDUtil.nextUUID().substring(0,10));
                user.setAddress(UUIDUtil.nextUUID().substring(0,10));
                user.setEmail(UUIDUtil.nextUUID().substring(0,10));
                user.setProfile(UUIDUtil.nextUUID().substring(0,10));
                user.setBirthday(DateUtil.randomDate());
                user.setRegisterDay(DateUtil.randomDate());
                user.setLoginDay(DateUtil.randomDate());
                user.setStatus(NumberUtil.getStatusInt());
                user.setAccount(NumberUtil.accountDecimal());
                user.setBalance(NumberUtil.balanceDecimal());
                user.setAge(NumberUtil.getAgeInt());
                user.setSex(NumberUtil.getSexInt());
                user.setAvatar(UUIDUtil.nextUUID().substring(0,10));
                user.setLevel(NumberUtil.getLevelInt());

                users.add(user);
            }

            total += users.size();

            List<List<User>> partition = ListUtils.partition(users, 500);

            CountDownLatch cdl = new CountDownLatch(users.size());

            log.info("正在写入数据库,第 {} 轮", (i + 1));

            AtomicInteger count = new AtomicInteger();
            int round = i + 1;
            partition.parallelStream().forEach(p -> {
                executorService.execute(() -> {
                    userMapper.insertBatch(p);
                    cdl.countDown();
                    log.info("{} -> 写完第 {} 批,批次 {}/{},第 {} 轮", Thread.currentThread().getName(), 
                    count.getAndIncrement() + 1, count.get(), partition.size(), round);
                });
            });

            log.info("第 {} 轮写入数据库结束", (i + 1));

        }

        log.info("{} 条数据插入数据库,耗时:{} s", total, (System.currentTimeMillis() - st) / 1000);

        return "batch insert success, " + total + " 条数据插入数据库,耗时:" + 
        (System.currentTimeMillis() - st) / 1000 + " s";
    }

}

100万数据性能测试

多线程

耗时74s

在这里插入图片描述

非多线程

耗时204s

在这里插入图片描述

总结

使用多线程性能几乎提升3倍

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在Spring Boot使用EasyExcel导入Excel文档时,如果数据量较大,可以考虑使用分批次读取数据的方式,避免一次性读取过多数据导致内存溢出的问题。 具体实现可以参考以下步骤: 1. 定义一个数据处理器类,实现EasyExcel的ReadListener接口,在onRead方法处理每一批次读取到的数据。 2. 在Controller定义一个方法,接收前端上传的Excel文件,并使用EasyExcel的read方法读取Excel文件,同时传入数据处理器类的实例作为参数。 3. 在数据处理器类,设置每批次读取的数据量,例如每次读取1000条数据。 4. 在onRead方法,处理每一批次读取到的数据,例如将数据保存到数据库。 5. 如果还有未处理完的数据,继续读取并处理,直到读取完所有数据。 下面是一个示例代码: ```java @Component public class ExcelDataListener implements ReadListener<User> { private List<User> userList = new ArrayList<>(); @Override public void onRead(List<User> data, AnalysisContext context) { userList.addAll(data); if (userList.size() >= 1000) { // 处理每一批次读取到的数据 saveUserList(userList); userList.clear(); } } @Override public void onException(Exception exception, AnalysisContext context) { // 处理异常 } private void saveUserList(List<User> userList) { // 将数据保存到数据库 } } @RestController public class ExcelController { @Autowired private ExcelDataListener excelDataListener; @PostMapping("/upload") public void uploadExcel(@RequestParam("file") MultipartFile file) throws IOException { EasyExcel.read(file.getInputStream(), User.class, excelDataListener).sheet().doRead(); // 处理剩余未处理的数据 excelDataListener.saveUserList(excelDataListener.getUserList()); } } ``` 注意,在使用分批次读取数据时,需要考虑如何处理异常情况,以及在处理完所有数据后如何清理资源。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BirdMan98

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值