java利用多线程批量插入数据

代码示例:

package com.atguigu.common.utils;

import com.atguigu.common.to.MemberPrice;
import org.springframework.util.CollectionUtils;

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

/**
 * @Author mischen
 * @Description java实现批量插入数据
 * @Date 2023/11/15 16:30
 * @Version 1.0
 */
public class BatchInsertDemo {

    public static void main(String[] args) {

    }

    public void addCouponCode(List<MemberPrice> lists){
        if (CollectionUtils.isEmpty(lists)) {
            return;
        }
        int numPerTimes = 500;
        if (lists.size() <= numPerTimes) {
            batchAdd(lists); //直接插入少于500条lists
        } else {
            //获取总数量
            int maxIndex = lists.size();
            //计算页数
            int maxTimes = maxIndex / numPerTimes;
            maxTimes += (maxIndex % numPerTimes) > 0 ? 1 : 0;
            int currentTimes = 0;
            while (currentTimes < maxTimes) {
                int fromIndex = numPerTimes * currentTimes;
                int toIndex = fromIndex + numPerTimes;
                toIndex = toIndex > maxIndex ? maxIndex : toIndex;
                List<MemberPrice> subList = lists.subList(fromIndex, toIndex);
                //这里是循环插入500条lists
                batchAdd(subList); //这里是去真正操作数据库的逻辑
                currentTimes++;
            }
        }
    }
    mybatis插入,可根据业务自行修改
    public void batchAdd(List<MemberPrice> lists) {
        if (CollectionUtils.isEmpty(lists)){

        }
    }

    //利用多线程批量插入数据
    public void insert() {
        // 通过一系列操作获取到要插入的集合,在此使用list代替
        List<MemberPrice> list = new ArrayList<>();

        // 获取虚拟机可用的最大处理器数量
        int availableProcessors = Runtime.getRuntime().availableProcessors();
        // 获取要添加的数据集合大小
        int total = list.size();
        // 每次插入的数量
        int batchSize = 1000;
        // 计算需要分多少批插入数据库(向上取整)
        int totalBatch = (total + batchSize - 1) / batchSize;
        // 手动创建线程池
        ExecutorService executor = new ThreadPoolExecutor(
                // 线程池核心线程数量
                availableProcessors,
                // 线程池最大数量
                availableProcessors + 1000,
                // 空闲线程存活时间
                1000,
                // 时间单位
                TimeUnit.MILLISECONDS,
                // 线程池所使用的缓冲队列
                new ArrayBlockingQueue<>(100),
                // 线程池对拒绝任务的处理策略
                //ThreadPoolExecutor.CallerRunsPolicy 是一种可伸缩队列策略。这种策略是当线程池中的线程数达到最大值,
                //并且已提交的任务数大于线程池中的线程数时,任务将在调用者线程中执行,而不是在线程池中的线程中执行。
                //这个策略可以控制任务的执行速度,防止线程池中的任务过多导致的资源耗尽。
                //————————————————
                new ThreadPoolExecutor.CallerRunsPolicy());

        // 将筛选出的结果分批次添加到表中
        for (int batchIndex = 0; batchIndex < totalBatch; batchIndex++) {
            // 当前插入批次的起始索引
            int startIndex = batchIndex * batchSize;
            // 当前插入批次的结束索引
            int endIndex = Math.min((batchIndex + 1) * batchSize, total);
            // 截取本次要添加的数据
            List<MemberPrice> insertList = list.subList(startIndex, endIndex);
            // 将每个批次的插入逻辑封装成一个Runnable对象
            Runnable task = () -> {
                // 添加本批次数据到数据库中
                userMapper.batchInsert(insertList);
            };
            // 提交添加任务
            executor.submit(task);
        }
        // 关闭线程池释放资源
        executor.shutdown();
    }

}

### 回答1: Java作为一门编程语言,拥有强大的多线程支持,通过利用Java多线程技术,可以有效地解决在数据库插入千万级数据时的性能瓶颈问题。 但是,在多线程插入数据库时,需要注意以下几点: 1.连接数限制 数据库通常会有连接数限制,过多的连接会导致数据库性能下降,通过使用连接池可以有效地控制连接数。 2.事务处理 在大数据量插入时,一次性插入可能会出现异常,这时候需要使用数据库事务管理技术,可以回滚错误的数据,确保数据的完整性。 3.线程数控制 线程数是需要根据机器的配置和系统负载情况合理调整的,过多的线程会浪费资源,过少的线程会导致性能下降。 4.数据批量提交 将需要插入的数据进行分批处理,进行批量提交,可以减少数据库交互次数,提高性能。 综上所述,通过合理利用Java多线程技术以及上述注意事项,在数据库插入千万级数据时,可以大大提高系统的性能,确保数据的有效插入。 ### 回答2: Java多线程数据库插入千万级数据是一项比较复杂的任务。在此之前需要确保数据库的表结构已经建立好,并且在写入数据时需要进行数据分析和处理,尽可能地优化数据的结构和存储方式。 为了提高插入数据的效率,可以采用多线程方式进行数据库插入操作。多线程技术可以将数据分批处理,每个线程负责一部分数据的插入。这样可以有效地提高数据的插入速度和效率。但同时也需要考虑到线程之间的同步问题,以及数据库的并发访问能力。 在进行多线程数据库插入时,需要注意以下几点: 1. 数据库连接池的使用:为了减少数据库连接和关闭的开销,可以采用数据库连接池的方式管理数据库连接。 2. 多线程的线程池:可以使用线程池来管理线程的数量,以控制系统资源的使用和避免过度消耗内存和CPU等资源。 3. 分批插入数据:可以将数据分成若干个批次进行插入,每个线程负责一部分数据的插入,这样可以减少单个事务的大小和对数据库的负载。 4. 数据库的并发控制:需要使用数据库的并发控制机制,以避免多个线程同时访问数据库时出现死锁等问题。 5. 数据结构和数据处理优化:需要对插入的数据进行预处理和优化,以充分利用数据库的性能优势,例如采用批量插入等方式。 总之,要在Java多线程数据库插入千万级数据时,需要对数据结构、线程安全和并发访问等方面进行深入的思考和优化,以达到最佳的性能和效率。 ### 回答3: Java 多线程对于数据库的插入千万级数据是一个非常明智的选择。使用多线程可以将数据插入过程分成多个小块,每个小块都可以被单独处理,从而加快整个过程,提高插入数据的效率。 以下是 Java 多线程数据库插入千万级数据的一些重要步骤和技巧: 1. 数据分片:在将数据插入到数据库之前,需要将数据划分成多个小块。这些小块数据可以并行插入到数据,这样可以提高插入数据的速度。 2. 在每个小块使用多线程:在每个小块,可以使用多个线程同时进行数据插入。这样可以充分利用所有可用资源,从而提高整个过程的效率。 3. 使用连接池:连接池可以帮助我们管理数据库连接,并提供连接复用、线程安全等功能。这样可以减少连接创建和销毁的开销,缩短数据插入时间。 4. 使用 batch 方式插入数据:在插入数据时,可以使用 batch 方式批量插入数据,这样可以减少与数据库的交互次数,从而提高插入数据的效率。 5. 优化 SQL 语句:在插入数据时,需要使用高效的 SQL 语句。例如,可以使用批量插入语句、预处理语句、存储过程等方式,减少 SQL 语句的执行时间和开销。 6. 监控和优化:在数据插入过程,需要实时监控系统资源的使用情况,及时检测并调整线程数、连接池大小等参数,以保证系统的稳定性和高效性。 7. 数据库性能优化:对于千万级数据的插入,数据库的性能优化也非常重要。例如,可以优化数据库的索引、表分区、缓存等,以提高数据库的查询和插入效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值