例:要插入的表为users
desc users
Name Null? Type
---------------------------------------------------- -------- -----------------
USER_ID NUMBER
USER_NAME VARCHAR2(50)
LOGIN_TIMES NUMBER
LAST_LOGIN DATE
sqlldr有两种用法:
1.控制文件+数据文件 --> 一般用这种.数据文件可是CSV文件,可以是PL/SQL DEV或Toad导出的,也可以sqlplus用spool导出的文件。
a.控制文件的内容如下:
options (skip=1) --在命令行执行sqlldr显示出的选项可以写在这里
load data
infile "/a.csv" --指定数据文件,可写多个如再写个infile "/b.csv",还可用badfile、discardfile指定坏数据和丢弃数据的文件
truncate --操作类型,截断表中原有记录。默认为insert表要为空;若为append追加;若为replace则delect表中原有记录
into table users --指定要插入记录的表
fields terminated by "," -- 数据中每行记录用 "," 分隔
optionally enclosed by '"' -- 数据中每个字段用 '"' 框起,比如字段中有 "," 分隔符时
trailing nullcols --表的字段没有对应的值时允许为空
(
virtual_column filler, --虚拟字段,可用filler来跳过由PL/SQL Developer 生成的第一列序号
user_id number,
user_name
login_times,
last_login date "yyyy-mm-dd hh24:mi:ss"
)
b.数据文件是csv文件,内容如下:
" ","USER_ID","USER_NAME","LOGIN_TIMES","LAST_LOGIN"
"1","1","Unmi","3","2009-1-5 20:34:44"
"2","2","","5","2008-10-15"
"3","3","mini","8","2009-1-2"
"4","4","Kypfos","",""
"5","5","nic","1","2008-12-23"
执行命令:
sqlldr sys/oracle@ocm as sysdba control=/user.txt
2.控制文件(包含数据) ----> 这种格式的控制文件可以由Toad导出
这种是控制文件中包含有数据,并用begindata连接,infile "filename" 改为infile *,内容如下:
options (skip=1)
load data
infile * --因为数据同控制文件在一起,所以为*表示
truncate
into table users
fields terminated by ","
trailing nullcols
(
virtual_column filler,
user_id "user_seq.nextval", --这一列取user_seq序列的下一值,而不用数据中提供的值
user_name "'hi'||upper(:user_name)", --还能用SQL函数或运算对数据加工处理
login_times terminated by "," NULLIF(login_times='NULL'), --可为列单独指定分隔符
last_login date "yyyy-mm-dd hh24:mi:ss" nullif(last_login="NULL") --当字段为"NULL"时就是null
)
begindata --数据从这里开始
,USER_ID,USER_NAME,LOGIN_TIMES,LAST_LOGIN
1,1,Unmi,3,2009-1-5 20:34
2,2,Fantasia,5,2008-10-15
3,3,mini,8,2009-1-2
4,4,Kypfos,NULL,NULL
5,5,nic,1,2008-12-23
执行一样的命令:
sqlldr sys/oracle@ocm as sysdba control=/user.txt
同样是使用 数据文件+控制文件。但是数据文件是sqlplus用spool导出的文件
a.控制文件的内容为:
options (skip=2,rows=128)
load data
infile "/script/4.sql"
into table users
append
trailing nullcols
(
user_id position(1:10), --不指定分隔符,在列里用position来定位
user_name position(11:61),
login_times position(*:73), -- *号表示开始位置在前一字段的结束位置
last_login position(*:93) date "yyyy-mm-dd hh24:mi:ss"
)
b.数据文件的内容为:
USER_ID USER_NAME LOGIN_TIMES LAST_LOGIN
---------- -------------------------------------------------- ----------- -------------------
1 Unmi 3 2009-01-05 20:34:44
2 5 2008-10-15 0:0:0
3 mini 8 2009-01-02 0:0:0
4 Kypfos
5 hello 1 2008-12-23 0:0:0
执行一样的命令:
sqlldr sys/oracle@ocm as sysdba control=/user.txt
注意:
1)常规导入是通过使用 INSERT语句来导入数据。Direct导入可以跳过数据库的相关逻辑而直接将数据导入到数据文件中, 可以提高导入数据的性能。当然,在很多情况下,不能使用此参数(如果主键重复的话会使索引的状态变成UNUSABLE!)。
2) 通过指定 UNRECOVERABLE选项,可以关闭数据库的日志。这个选项只能和 direct 一起使用。
当加载大量数据时(大约超过10GB),最好抑制日志的产生:
SQL>ALTER TABLE RESULTXT nologging; 这样不产生REDO LOG,可以提高效率。
然后在控制文件中 load data 上面加一行:unrecoverable。此选项必须要与DIRECT共同应用。
3) 对于超大数据文件的导入就要用并发操作了,即同时运行多个导入任务.
sqlldr userid=/ control=result1.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true