dmfldr不同字符集的装载效率比较

【dmfldr概述】

使用dmfldr工具能够把按照一定格式排序的文本数据以简单、快速、高效的方式载入到DM数据库中,或把DM数据库中的数据按照一定格式写入文本文件。

dmfldr命令中USERID和控制文件两个为必选参数。USERID用来指定用户名和密码等,控制文件用来指定导入或导出的表、数据文件、行分隔符、列分隔符等信息。在数据库安装目录的bin目录下可以找到dmfldr的执行文件,在该目录下执行dmfldr help就可查看命令行参数说明。

具体语法如下:

【建表并生成相关文件】

本次实验是简单模拟一个数据装载并且对装载数据一致且不是单字节字符的时候,不同字符集设置对我们的装载数据效率是否会有影响进行探讨。

首先利用disql在数据库上建立一张能够匹配原始数据的表。

2.1创建表

SQL> create table ABC. test1(C1 int,C2 int,C3 date) ;操作已执行已用时间: 11. 074(毫秒).执行号:109.

2.2创建控制文件以及原始数据​​​​​​​

[root@localhost bin]# vi /opt/data/ABC.ABC. ctrl ABC. txt[root@localhost bin]# vi /opt/data/ABC. txt1 1 |2015-11-062 2|2015-11-053 3|2015-11 04

2.3控制文件内容如下:

【不同字符集情况下,导入比较】

在装载数据一致且不是单字节字符的时候,不同字符集设置对我们的装载数据效率是否会有影响,于是进行了下面操作进行试验。

3.1编码格式为GBK

运行时间:3.000(ms)​​​​​​​

OPTIONS(CHARACTER CODE =’GBK’)LOAD DATAINFILE' /opt/data/ABC. txt'INTO TABLE ABC. testlFIELDS ‘|’(C1 TERMINATED BY ‘’,C2,C3 DATE FORMAT ‘yyyy-mm-dd’)

3.2编码格式为UTF-8

运行时间:3.792(ms)​​​​​​​

OPTIONS(CHARACTER CODE =’UTF-8’)LOAD DATAINFILE' /opt/data/ABC. txt'INTO TABLE ABC. testlFIELDS ‘|’(C1 TERMINATED BY ‘’,C2,C3 DATE FORMAT ‘yyyy-mm-dd’)

3.3编码格式为SINGLE_BYTE

运行时间:4.458(ms)​​​​​​​

OPTIONS(CHARACTER CODE =’SINGLE_BYTE’)LOAD DATAINFILE' /opt/data/ABC. txt'INTO TABLE ABC. testlFIELDS ‘|’(C1 TERMINATED BY ‘’,C2,C3 DATE FORMAT ‘yyyy-mm-dd’)

3.4编码格式为GB18030

运行时间:4.039(ms)​​​​​​​

OPTIONS(CHARACTER CODE =’GB18030’)LOAD DATAINFILE' /opt/data/ABC. txt'INTO TABLE ABC. testlFIELDS ‘|’(C1 TERMINATED BY ‘’,C2,C3 DATE FORMAT ‘yyyy-mm-dd’)

【结语】

在相同数据条件且不是单字节字符的时候,数据的编码格式为GBK时,载入效率更高一些。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值