MySQL如何快速生成千万数据量

  • 实现思路
  • 1、创建内存表和普通表
  • 2、创建函数及存储过程

创建生成n个随机数字的函数
创建生成号码函数
创建随机字符串函数
创建插入内存表数据的存储过程
创建内存表数据插入普通表的存储过程

  • 3、调用存储过程插入数据

修改mysql内存表存储大小的值
调用我写的另一个存储过程:add_test_user_memory_to_outside

实现思路

在我们平时工作或学习的过程中,有时需要在数据库中生成大量的测试数据,这个时候,我们可以利用mysql内存表插入速度快的特点,先利用函数和存储过程在内存表中生成数据,然后再从内存表插入普通表中。经过我的测试,这种方案插入数据是非常快的。

下面是实现步骤。
1、创建内存表和普通表

#创建内存表
CREATE TABLE `test_user_memory` (
 `id` int(11) NOT NULL AUTO_INCREMENT comment '主键id',
 `user_id` varchar(36) NOT NULL  comment '用户id',
 `user_name` varchar(30) NOT NULL comment '用户名称',
 `phone` varchar(20) NOT NULL comment '手机号码',
 `lan_id` int(9) NOT NULL comment '本地网',
 `region_id` int(9) NOT NULL comment '区域',
 `create_time` datetime NOT NULL comment '创建时间',
 PRIMARY KEY (`id`),
 KEY `idx_user_id` (`user_id`)
) ENGINE=MEMORY DEFAULT CHARSET=utf8mb4;

#创建普通表
CREATE TABLE `test_user` (
 `id` int(11) NOT NULL AUTO_INCREMENT comment '主键id',
 `user_id` varchar(36) NOT NULL  comment '用户id',
 `user_name` varchar(30) NOT NULL comment '用户名称',
 `phone` varchar(20) NOT NULL comment '手机号码',
 `lan_id` int(9) NOT NULL comment '本地网',
 `region_id` int(9) NOT NULL comment '区域',
 `create_time` datetime NOT NULL comment '创建时间',
 PRIMARY KEY (`id`),
 KEY `idx_user_id` (`user_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

2、创建函数及存储过程

创建生成n个随机数字的函数

生成手机号码的时候要用到

#生成n个随机数字
DELIMITER $$
CREATE FUNCTION randNum(n int) RETURNS VARCHAR(255)
BEGIN
    DECLARE chars_str varchar(20) DEFAULT '0123456789';
    DECLARE return_str varchar(255) DEFAULT '';
    DECLARE i INT DEFAULT 0;
    WHILE i < n DO
        SET return_str = concat(return_str,substring(chars_str , FLOOR(1 + RAND()*10 ),1));
        SET i = i +1;
    END WHILE;
    RETURN return_str;
END $$
DELIMITER;

创建生成号码函数
#生成随机手机号码

# 定义常用的手机头 130 131 132 133 134 135 136 137 138 139 186 187 189 151 157
#SET starts = 1+floor(rand()*15)*4;   截取字符串的开始是从 1、5、9、13 ...开始的。floor(rand()*15)的取值范围是0~14
#SET head = substring(bodys,starts,3);在字符串bodys中从starts位置截取三位

DELIMITER $$
CREATE FUNCTION generatePhone() RETURNS varchar(20)
BEGIN
DECLARE head char(3);
DECLARE phone varchar(20);
DECLARE bodys varchar(100) default "130 131 132 133 134 135 136 137 138 139 186 187 189 151 157";
DECLARE starts int;
SET starts = 1+floor(rand()*15)*4;  
SET head = trim(substring(bodys,starts,3));  
SET phone = trim(concat(head,randNum(8)));
RETURN phone;
END $$
DELIMITER ;

创建随机字符串函数

#创建随机字符串和随机时间的函数
DELIMITER $$
CREATE FUNCTION `randStr`(n INT) RETURNS varchar(255) CHARSET utf8mb4
DETERMINISTIC
BEGIN
 DECLARE chars_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
 DECLARE return_str varchar(255) DEFAULT '' ;
 DECLARE i INT DEFAULT 0;
 WHILE i < n DO
  SET return_str = concat(return_str, substring(chars_str, FLOOR(1 + RAND() * 62), 1));
  SET i = i + 1;
 END WHILE;
 RETURN return_str;
 END$$
 DELIMITER;

创建插入内存表数据的存储过程

# 创建插入内存表数据存储过程   入参n是多少就插入多少条数据
DELIMITER $$
CREATE PROCEDURE `add_test_user_memory`(IN n int)
 BEGIN
 DECLARE i INT DEFAULT 1;
 WHILE (i <= n) DO
  INSERT INTO test_user_memory (user_id, user_name, phone, lan_id,region_id, create_time) VALUES (uuid(), randStr(20), generatePhone(), FLOOR(RAND() * 1000), FLOOR(RAND() * 100), NOW());
  SET i = i + 1;
 END WHILE;
 END $$
 DELIMITER ;

创建内存表数据插入普通表存储过程

此处利用对内存表的循环插入和删除来实现批量生成数据,这样可以不需要更改mysql默认的max_heap_table_size值也照样可以生成百万或者千万的数据。
max_heap_table_size默认值是16M。
max_heap_table_size的作用是配置用户创建内存临时表的大小,配置的值越大,能存进内存表的数据就越多。

#循环从内存表获取数据插入普通表
#参数描述 n表示循环调用几次;count表示每次插入内存表和普通表的数据量
 DELIMITER $$
 CREATE PROCEDURE `add_test_user_memory_to_outside`(IN n int, IN count int)
 BEGIN
 DECLARE i INT DEFAULT 1;
 WHILE (i <= n) DO
  CALL add_test_user_memory(count);
 INSERT INTO test_user SELECT * FROM test_user_memory;
 delete from test_user_memory;
 SET i = i + 1;
 END WHILE;
 END $$
 DELIMITER ;

3、调用存储过程插入数据

#先调用存储过程往内存表插入一万条数据,然后再把内存表的一万条数据插入普通表
CALL add_test_user_memory(10000);
#一次性把内存表的数据插入到普通表,这个过程是很快的
INSERT INTO test_user SELECT * FROM test_user_memory;
#清空内存表数据
delete from test_user_memory;

先简单测试一下插入内存表一万条数据要花多少时间
在这里插入图片描述
把内存表的一万条数据一次性插入普通表,只需要很短的时间就完成了,如下图所示
在这里插入图片描述
查询刚刚插入的普通表的数据
在这里插入图片描述
因为我没有更改数据库内存表内存大小,所以单次插入内存表一万条数据是没问题的,但是单次插入内存表十万条数据就不行了,会报内存表已满的异常。如下图所示
在这里插入图片描述
修改mysql内存表存储大小的值

  1. 通过执行mysql命令修改
    SET GLOBAL tmp_table_size=2147483648;
    SET GLOBALmax_heap_table_size=2147483648;
  2. 通过修改mysql配置文件
    vi /etc/my.cnf
    [mysqld] max_heap_table_size =2048M
    tmp_table_size = 2048M
    在这里插入图片描述

二、调用另一个存储过程

add_test_user_memory_to_outside
这个存储过程就是通过不断循环插入内存表,再从内存表获取数据插入普通表,最后删除内存表,以此循环直至循环结束。

#循环100次,每次生成10000条数据 总共生成一百万条数据
CALL add_test_user_memory_to_outside(100,10000);

在这里插入图片描述
在这里插入图片描述
学习借鉴微信公众号IT老哥文章!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值