如数据为:
1,1,Unmi,3,2009-1-5 20:34
2,2,Fantasia,5,2008-10-15
1,2,satiu,5,2008-10-15
想用序列替换一列的指,可用filler虚拟列的方法实现,详见例子二
原帖:http://blog.csdn.net/access20032004/article/details/7064919
- 例:要插入的表为users
- desc users
- Name Null? Type
- ---------------------------------------------------- -------- -----------------
- USER_ID NUMBER
- USER_NAME VARCHAR2(50)
- LOGIN_TIMES NUMBER
- LAST_LOGIN DATE
1.控制文件+数据文件 --> 一般用这种.数据文件可是CSV文件,可以是PL/SQL DEV或Toad导出的,也可以sqlplus用spool导出的文件。
- a.控制文件的内容如下:
- options (skip=1) --在命令行执行sqlldr显示出的选项可以写在这里
- load data
- infile "/a.csv" --指定数据文件,可写多个如再写个infile "/b.csv",还可用badfile、discardfile指定坏数据和丢弃数据的文件
- truncate --操作类型,截断表中原有记录。默认为insert表要为空;若为append追加;若为replace则delect表中原有记录
- into table users --指定要插入记录的表
- fields terminated by "," -- 数据中每行记录用 "," 分隔
- optionally enclosed by '"' -- 数据中每个字段用 '"' 框起,比如字段中有 "," 分隔符时
- trailing nullcols --表的字段没有对应的值时允许为空
- (
- virtual_column filler, --虚拟字段,可用filler来跳过由PL/SQL Developer 生成的第一列序号
- user_id number,
- user_name
- login_times,
- last_login date "yyyy-mm-dd hh24:mi:ss"
- )
- b.数据文件是csv文件,内容如下:
- " ","USER_ID","USER_NAME","LOGIN_TIMES","LAST_LOGIN"
- "1","1","Unmi","3","2009-1-5 20:34:44"
- "2","2","","5","2008-10-15"
- "3","3","mini","8","2009-1-2"
- "4","4","Kypfos","",""
- "5","5","nic","1","2008-12-23"
- 执行命令:
- sqlldr sys/oracle@ocm as sysdba control=/user.txt
- 这种是控制文件中包含有数据,并用begindata连接,infile "filename" 改为infile *,内容如下:
- options (skip=1)
- load data
- infile * --因为数据同控制文件在一起,所以为*表示
- truncate
- into table users
- fields terminated by ","
- trailing nullcols
- (
- virtual_column filler,
- user_id "user_seq.nextval", --这一列取user_seq序列的下一值,而不用数据中提供的值
- user_name "'hi'||upper(:user_name)", --还能用SQL函数或运算对数据加工处理
- login_times terminated by "," NULLIF(login_times='NULL'), --可为列单独指定分隔符
- last_login date "yyyy-mm-dd hh24:mi:ss" nullif(last_login="NULL") --当字段为"NULL"时就是null
- )
- begindata --数据从这里开始
- ,USER_ID,USER_NAME,LOGIN_TIMES,LAST_LOGIN
- 1,1,Unmi,3,2009-1-5 20:34
- 2,2,Fantasia,5,2008-10-15
- 3,3,mini,8,2009-1-2
- 4,4,Kypfos,NULL,NULL
- 5,5,nic,1,2008-12-23
- 执行一样的命令:
- sqlldr sys/oracle@ocm as sysdba control=/user.txt
- 同样是使用 数据文件+控制文件。但是数据文件是sqlplus用spool导出的文件
- a.控制文件的内容为:
- options (skip=2,rows=128)
- load data
- infile "/script/4.sql"
- into table users
- append
- trailing nullcols
- (
- user_id position(1:10), --不指定分隔符,在列里用position来定位
- user_name position(11:61),
- login_times position(*:73), -- *号表示开始位置在前一字段的结束位置
- last_login position(*:93) date "yyyy-mm-dd hh24:mi:ss"
- )
- b.数据文件的内容为:
- USER_ID USER_NAME LOGIN_TIMES LAST_LOGIN
- ---------- -------------------------------------------------- ----------- -------------------
- 1 Unmi 3 2009-01-05 20:34:44
- 2 5 2008-10-15 0:0:0
- 3 mini 8 2009-01-02 0:0:0
- 4 Kypfos
- 5 hello 1 2008-12-23 0:0:0
- 执行一样的命令:
- sqlldr sys/oracle@ocm as sysdba control=/user.txt
注意:
1)常规导入是通过使用 INSERT语句来导入数据。Direct导入可以跳过数据库的相关逻辑而直接将数据导入到数据文件中, 可以提高导入数据的性能。当然,在很多情况下,不能使用此参数(如果主键重复的话会使索引的状态变成UNUSABLE!)。
2) 通过指定 UNRECOVERABLE选项,可以关闭数据库的日志。这个选项只能和 direct 一起使用。
当加载大量数据时(大约超过10GB),最好抑制日志的产生:
SQL>ALTER TABLE RESULTXT nologging; 这样不产生REDO LOG,可以提高效率。
然后在控制文件中 load data 上面加一行:unrecoverable。此选项必须要与DIRECT共同应用。
3) 对于超大数据文件的导入就要用并发操作了,即同时运行多个导入任务.
sqlldr userid=/ control=result1.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true