向数据库中插入千万级数据

本文详细介绍使用Java批量插入1000万条记录至MySQL数据库的方法,包括环境配置、SQL语句优化及max_allowed_packet参数调整,实现高效数据生成。

1. 数据库环境

1.1 MySQL版本

我用到的是MySQL5.6.38版本。

1.2 数据表创建

CREATE TABLE `student` (
  `id` char(32) NOT NULL,
  `t_name` varchar(255) DEFAULT NULL,
  `t_password` varchar(255) DEFAULT NULL,
  `sex` char(2) DEFAULT NULL,
  `description` varchar(255) DEFAULT NULL,
  `pic_url` varchar(255) DEFAULT NULL,
  `school_name` varchar(255) DEFAULT NULL,
  `regist_date` datetime DEFAULT NULL,
  `remark` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

1.3 更改MySQL数据库max_allowed_packet属性大小

max_allowed_packet属性用于限制Server接受的数据包大小。有时候大的插入和更新会受 max_allowed_packet 参数限制,导致写入或者更新失败。

查看默认的max_allowed_packet大小(默认大小只有4M或1M,由版本决定)

show VARIABLES like '%max_allowed_packet%'

修改max_allowed_packet大小

set global max_allowed_packet = 100*1024*1024;

修改参数大小后,一定要重新登录,才能看到属性值的改变。

在这里插入图片描述

2. 大数据量的生产

package _13数据库超大数据量生成;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.SQLException;
import java.util.Date;
import java.util.UUID;

/**
 * @Auther: 田金东
 * @Date: 10/31/0031
 **/
public class InsertTest {
    private static final String URL = "jdbc:mysql://127.0.0.1:3306/test?serverTimezone=GMT%2B8&useUnicode=true&characterEncoding=utf-8";
    private static final String DRIVER = "com.mysql.jdbc.Driver";
    private static final String USERNAME = "root";
    private static final String PASSWORD = "sss";

    public static void main(String[] args) throws SQLException, ClassNotFoundException {
        Class.forName(DRIVER);
        Connection conn = DriverManager.getConnection(URL, USERNAME, PASSWORD);//获取连接
        if (conn != null) {
            System.out.println("获取连接成功");
            insert(conn);
        } else {
            System.out.println("获取连接失败");
        }
    }

    public static void insert(Connection conn) {
        // 开始时间
        Long begin = new Date().getTime();
        // sql前缀
        String prefix = "INSERT INTO student (id,t_name,t_password,sex,description,pic_url,school_name,regist_date,remark) VALUES ";
        try {
            // 保存sql后缀
            StringBuffer suffix = new StringBuffer();
            // 设置事务为非自动提交
            conn.setAutoCommit(false);
            // 比起st,pst会更好些
            PreparedStatement pst = (PreparedStatement) conn.prepareStatement(" ");//准备执行语句
            // 外层循环,总提交事务次数
            for (int i = 1; i <= 10; i++) {
                suffix = new StringBuffer();
                // 第j次提交步长
                for (int j = 1; j <= 100000; j++) {
                    String id = UUID.randomUUID().toString().replaceAll("-","");
                    // 构建SQL后缀
                    suffix.append("('" + id + "','" + i * j + "','123456'" + ",'男'" + ",'教师'" + ",'www.bbk.com'" + ",'XX大学'" + ",'" + "2016-08-12 14:43:26" + "','备注'" + "),");
                }
                // 构建完整SQL
                String sql = prefix + suffix.substring(0, suffix.length() - 1);
                // 添加执行SQL
                pst.addBatch(sql);
                // 执行操作
                pst.executeBatch();
                // 提交事务
                conn.commit();
                // 清空上一次添加的数据
                suffix = new StringBuffer();
            }
            // 头等连接
            pst.close();
            conn.close();
        } catch (SQLException e) {
            e.printStackTrace();
        }
        // 结束时间
        Long end = new Date().getTime();
        // 耗时
        System.out.println("1000万条数据插入花费时间 : " + (end - begin) / 1000 + " s");
        System.out.println("插入完成");
    }

}

在这里插入图片描述

参考文章:https://www.cnblogs.com/fanwencong/p/5765136.html

### 回答1: Java作为一门编程语言,拥有强大的多线程支持,通过利用Java多线程技术,可以有效地解决在数据库插入千万级数据时的性能瓶颈问题。 但是,在多线程插入数据库时,需要注意以下几点: 1.连接数限制 数据库通常会有连接数限制,过多的连接会导致数据库性能下降,通过使用连接池可以有效地控制连接数。 2.事务处理 在大数据插入时,一次性插入可能会出现异常,这时候需要使用数据库事务管理技术,可以回滚错误的数据,确保数据的完整性。 3.线程数控制 线程数是需要根据机器的配置和系统负载情况合理调整的,过多的线程会浪费资源,过少的线程会导致性能下降。 4.数据批量提交 将需要插入数据进行分批处理,进行批量提交,可以减少数据库交互次数,提高性能。 综上所述,通过合理利用Java多线程技术以及上述注意事项,在数据库插入千万级数据时,可以大大提高系统的性能,确保数据的有效插入。 ### 回答2: Java多线程数据库插入千万级数据是一项比较复杂的任务。在此之前需要确保数据库的表结构已经建立好,并且在写入数据时需要进行数据分析和处理,尽可能地优化数据的结构和存储方式。 为了提高插入数据的效率,可以采用多线程方式进行数据库插入操作。多线程技术可以将数据分批处理,每个线程负责一部分数据插入。这样可以有效地提高数据插入速度和效率。但同时也需要考虑到线程之间的同步问题,以及数据库的并发访问能力。 在进行多线程数据库插入时,需要注意以下几点: 1. 数据库连接池的使用:为了减少数据库连接和关闭的开销,可以采用数据库连接池的方式管理数据库连接。 2. 多线程的线程池:可以使用线程池来管理线程的数量,以控制系统资源的使用和避免过度消耗内存和CPU等资源。 3. 分批插入数据:可以将数据分成若干个批次进行插入,每个线程负责一部分数据插入,这样可以减少单个事务的大小和对数据库的负载。 4. 数据库的并发控制:需要使用数据库的并发控制机制,以避免多个线程同时访问数据库时出现死锁等问题。 5. 数据结构和数据处理优化:需要对插入数据进行预处理和优化,以充分利用数据库的性能优势,例如采用批量插入等方式。 总之,要在Java多线程数据库插入千万级数据时,需要对数据结构、线程安全和并发访问等方面进行深入的思考和优化,以达到最佳的性能和效率。 ### 回答3: Java 多线程对于数据库插入千万级数据是一个非常明智的选择。使用多线程可以将数据插入过程分成多个小块,每个小块都可以被单独处理,从而加快整个过程,提高插入数据的效率。 以下是 Java 多线程数据库插入千万级数据的一些重要步骤和技巧: 1. 数据分片:在将数据插入数据库之前,需要将数据划分成多个小块。这些小块中的数据可以并行插入数据库中,这样可以提高插入数据的速度。 2. 在每个小块中使用多线程:在每个小块中,可以使用多个线程同时进行数据插入。这样可以充分利用所有可用资源,从而提高整个过程的效率。 3. 使用连接池:连接池可以帮助我们管理数据库连接,并提供连接复用、线程安全等功能。这样可以减少连接创建和销毁的开销,缩短数据插入时间。 4. 使用 batch 方式插入数据:在插入数据时,可以使用 batch 方式批量插入数据,这样可以减少与数据库的交互次数,从而提高插入数据的效率。 5. 优化 SQL 语句:在插入数据时,需要使用高效的 SQL 语句。例如,可以使用批量插入语句、预处理语句、存储过程等方式,减少 SQL 语句的执行时间和开销。 6. 监控和优化:在数据插入过程中,需要实时监控系统资源的使用情况,及时检测并调整线程数、连接池大小等参数,以保证系统的稳定性和高效性。 7. 数据库性能优化:对于千万级数据插入数据库的性能优化也非常重要。例如,可以优化数据库的索引、表分区、缓存等,以提高数据库的查询和插入效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值