Oracle快速构造大量测试数据

DBA经常会需要自己造些数据做测试,一般分为两类:一种是表占的储存量非常大,但行数可能并不多,主要用于备份类的测试;另一种表行数多,但表占的储存量可能并不大,主要用于sql优化类的测试。

如果可以,建议在插入数据时关归档、开并行,速度会更快。

一、 构造占大量存储空间的表

如果没有特别要求的话,最简单的方法就是直接往表里插文件,例如Oracle的安装包,一行就有几G的量。

建议不要用dd命令生成的文件,这种文件里面内容全是0,在备份时压缩比非常高(测试606G数据压缩后备份文件仅7.6G,开4个并行备份仅35分钟),但实际生产库不可能出现这种情况,测试得到的数据准确度非常低。

1. 将文件插入Oracle表

  • 创建os目录并授权oracle访问
mkdir -p /data/dump
chown oracle.oinstall /data/dump
  • 在数据库中创建对应DIRECTORY并授权业务用户访问
CREATE OR REPLACE DIRECTORY DIR_FILE AS '/data/dump';
grant read,write on directory DIR_FILE to bakuser;

  • 将需要插入的文件放在/data/dump目录下,这里是test.file,一个10M的文件
  • 创建测试表
create table bakuser.tb_attachment(FILENAME VARCHAR(100),CONTENT BLOB);
  • 插入一行数据
DECLARE 
        TEMPING BLOB;  --申明BLOB类型变量
        tempdir BFILE:=BFILENAME('DIR_FILE','test.file');
        BEGIN 
        insert into bakuser.tb_attachment values('test.file',EMPTY_BLOB()) RETURNING CONTENT INTO TEMPING; 
        DBMS_LOB.FILEOPEN(tempdir); 
        DBMS_LOB.LOADFROMFILE(temping,tempdir,DBMS_LOB.GETLENGTH(tempdir)); 
        DBMS_LOB.FILECLOSE(tempdir);
        COMMIT;
END;
/

2. 循环反复插入数据

可以直接insert也可以用并行

alter session force parallel dml;
insert into /*+ append parallel(4) */ bakuser.tb_attachment select /*+ parallel(4) */ * from bakuser.tb_attachment;

二、 构造具有大量行的表

1. 不需随机数据

用ctas创建一个表,然后反复查询自身并插入,数据量会呈指数级上升。

create table tmp as select * from dba_objects;
-- 反复执行下面语句直到数据量足够
insert into tmp select * from tmp;
commit;

-- 当数据量达到千万级时可使用并行
alter session force parallel dml;
insert into /*+ append parallel(4) */ tmp select /*+ parallel(4) */ * from tmp;
commit;

2. 生成随机数据

select rownum as id,to_char(sysdate + rownum/24/3600,'yyyy-mm-dd hh24:mi:ss') as inc_datetime,trunc(dbms_random.value(0,100)) as random_id,dbms_random.string('x',20) random_string 
from dual 
connect by level <= 10; 

ID INC_DATETIME RANDOM_ID RANDOM_STRING 
---------- ------------------- ---------- -------------------------------------------------------------------------------- 
1 2009-12-08 19:43:14 76 GWMU280MIVBKKOCZV620 
2 2009-12-08 19:43:15 34 GNV88O6TDHD3TWC5GWI5 
3 2009-12-08 19:43:16 77 LI6H4O5IAHQIMO4B0WMH 
4 2009-12-08 19:43:17 99 LP7XP49I0YOJIYSJDQZO 
5 2009-12-08 19:43:18 55 V3284X9RXW4UZI8BQMO3 
6 2009-12-08 19:43:19 16 T0OA52UAOGHL1TT46H25 
7 2009-12-08 19:43:20 61 UY6RUOF7HWTO86942FLP 
8 2009-12-08 19:43:21 25 JYXO4OPEW8J1CKVCPDJR 
9 2009-12-08 19:43:22 10 DONU6W9QVQM3KJ2UG8LO 
10 2009-12-08 19:43:23 76 J8DJLVNOUIZDXE4UXUJG 

10 rows selected

上面SQL利用Oracle语法的几个实用小技巧实现,均可按需修改

  • 利用Oracle特有的connect by树形连接语法生成测试记录,level <= 10 表示要生成10条记录
  • 利用rownum虚拟列生成递增的整数数据;
  • 利用sysdate函数加一些简单运算来生成日期数据,本例中是每条记录的时间加1秒;
  • 利用dbms_random.value函数生成随机的数值型数据,本例中是生成0到100之间的随机整数;
  • 利用dbms_random.string函数生成随机的字符型数据,本例中是生成长度为20的随机字符串,字符串中可以包括字符或数字

要生成10万条测试记录表可以用如下SQL

create table myTestTable as 
select rownum as id,
               to_char(sysdate + rownum/24/3600, 'yyyy-mm-dd hh24:mi:ss') as inc_datetime,
               trunc(dbms_random.value(0, 100)) as random_id,
               dbms_random.string('x', 20) random_string
          from dual
        connect by level <= 100000;

随机生成测试数据

-- 随机生成测试数据
update es_sms_customer set 
       sex=floor(dbms_random.value(0,3)) 
       ,name=dbms_random.string('A',6)
       ,id_card=111311198305100988 + floor(dbms_random.value(0,811311198305100988))
       ,house_phone='0'||floor(dbms_random.value(1000000001,80000000000))
       ,mobile=10000000000 + floor(dbms_random.value(3111111111,3999999999))
       ,fax='0'||floor(dbms_random.value(1000000001,80000000000))
       ,post_code=''||floor(dbms_random.value(100001,999999))
       ,email=dbms_random.string('L',6)||'@'||dbms_random.string('L',4)||'.com'
       ,qq=floor(dbms_random.value(10000001,999999999))
       ,addr=dbms_random.string('L',16)
       ,birth_day=birth_day+365*floor(dbms_random.value(1,50))
       ,occupation=floor(dbms_random.value(0,5))
       ,fixed_assets=floor(dbms_random.value(0,8))
       ,car_owner=floor(dbms_random.value(0,3))
       ,car_buy_time=birth_day+365*floor(dbms_random.value(1,50))
       ,car_brand=dbms_random.string('L',5)
       ,bui_name=dbms_random.string('L',5)
       ,car_price=floor(dbms_random.value(5,500))
       ,bui_area_count=floor(dbms_random.value(80,300))
       ,bui_addr=dbms_random.string('L',10)
       ,bui_post=''||floor(dbms_random.value(100001,999999))
       ,bui_manager=dbms_random.string('L',10)
       ,bui_developer=dbms_random.string('L',10)
       where rownum<1000;

参考

Oracle生成千万测试数据 - Agoly - 博客园

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
在Java中,可以使用JDBC API来连接Oracle数据库并执行插入操作。为了快速插入大量数据,我们可以考虑以下几个方面: 1. 使用批处理:可以将多个插入操作合并为一个批处理操作,这样可以减少网络通信和数据库操作的开销,从而提高插入速度。 2. 使用预编译语句:使用预编译语句可以减少每次执行SQL语句的开销,从而提高插入速度。 3. 调整事务提交频率:在插入大量数据时,可以将事务提交频率调整为每插入一定数量的数据就提交一次事务,这样可以减少事务提交开销,从而提高插入速度。 4. 调整Oracle数据库参数:可以通过调整Oracle数据库的参数,如增加undo表空间大小、增加SGA大小等,来优化数据库性能,从而提高插入速度。 示例代码: ``` // 假设有一个数据集需要插入到Oracle数据库中 List<Data> dataList = ... // 获取数据库连接 Connection conn = DriverManager.getConnection(url, username, password); // 创建预编译语句 String sql = "INSERT INTO table_name (column1, column2, ...) VALUES (?, ?, ...)"; PreparedStatement ps = conn.prepareStatement(sql); // 开始插入数据 int batchSize = 1000; int count = 0; for (Data data : dataList) { // 设置预编译语句的参数 ps.setXXX(1, data.getColumn1()); ps.setXXX(2, data.getColumn2()); ... ps.addBatch(); // 添加到批处理中 count++; if (count % batchSize == 0) { ps.executeBatch(); // 执行批处理 conn.commit(); // 提交事务 } } if (count % batchSize != 0) { ps.executeBatch(); // 执行剩余的批处理 conn.commit(); // 提交事务 } // 关闭连接 ps.close(); conn.close(); ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Hehuyi_In

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值