sqlldr使用的三个例子

最新推荐文章于 2019-07-31 15:28:40 发布

access20032004

最新推荐文章于 2019-07-31 15:28:40 发布

阅读量1.4k

点赞数

分类专栏： oracle学习笔记文章标签： login user parallel null table date

本文链接：https://blog.csdn.net/access20032004/article/details/7064919

版权

oracle学习笔记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

例：要插入的表为users
      desc users
      Name                                                 Null?    Type
      ---------------------------------------------------- -------- -----------------
      USER_ID                                                       NUMBER
      USER_NAME                                                     VARCHAR2(50)
      LOGIN_TIMES                                                   NUMBER
      LAST_LOGIN                                                    DATE

sqlldr有两种用法：

1.控制文件+数据文件 --> 一般用这种.数据文件可是CSV文件，可以是PL/SQL DEV或Toad导出的，也可以sqlplus用spool导出的文件。

  a.控制文件的内容如下：
      options (skip=1)            --在命令行执行sqlldr显示出的选项可以写在这里
      load data
      infile "/a.csv"             --指定数据文件，可写多个如再写个infile "/b.csv",还可用badfile、discardfile指定坏数据和丢弃数据的文件
      truncate                    --操作类型，截断表中原有记录。默认为insert表要为空；若为append追加；若为replace则delect表中原有记录
      into table users            --指定要插入记录的表
      fields terminated by ","    -- 数据中每行记录用 "," 分隔
      optionally enclosed by '"'  -- 数据中每个字段用 '"' 框起，比如字段中有 "," 分隔符时 
      trailing nullcols           --表的字段没有对应的值时允许为空
      (
      virtual_column filler,      --虚拟字段，可用filler来跳过由PL/SQL Developer 生成的第一列序号
      user_id number,
      user_name
      login_times,
      last_login date "yyyy-mm-dd hh24:mi:ss"
      )
 

  b.数据文件是csv文件，内容如下：
      "   ","USER_ID","USER_NAME","LOGIN_TIMES","LAST_LOGIN"   
      "1","1","Unmi","3","2009-1-5 20:34:44"   
      "2","2","","5","2008-10-15"   
      "3","3","mini","8","2009-1-2"   
      "4","4","Kypfos","",""   
      "5","5","nic","1","2008-12-23"  

执行命令：
sqlldr sys/oracle@ocm as sysdba control=/user.txt

2.控制文件（包含数据） ----> 这种格式的控制文件可以由Toad导出

   这种是控制文件中包含有数据，并用begindata连接，infile "filename" 改为infile *,内容如下：
      options (skip=1)            
      load data
      infile *                    --因为数据同控制文件在一起，所以为*表示
      truncate                    
      into table users    
      fields terminated by ","     
      trailing nullcols           
      (
      virtual_column filler,      
      user_id "user_seq.nextval", --这一列取user_seq序列的下一值，而不用数据中提供的值
      user_name "'hi'||upper(:user_name)", --还能用SQL函数或运算对数据加工处理
      login_times terminated by "," NULLIF(login_times='NULL'),         --可为列单独指定分隔符
      last_login date "yyyy-mm-dd hh24:mi:ss" nullif(last_login="NULL") --当字段为"NULL"时就是null
      )
      begindata                   --数据从这里开始
      ,USER_ID,USER_NAME,LOGIN_TIMES,LAST_LOGIN   
      1,1,Unmi,3,2009-1-5 20:34   
      2,2,Fantasia,5,2008-10-15   
      3,3,mini,8,2009-1-2   
      4,4,Kypfos,NULL,NULL   
      5,5,nic,1,2008-12-23

执行一样的命令：
sqlldr sys/oracle@ocm as sysdba control=/user.txt

同样是使用 数据文件+控制文件。但是数据文件是sqlplus用spool导出的文件
    a.控制文件的内容为：
      options (skip=2,rows=128)
      load data
      infile "/script/4.sql"
      into table users
      append
      trailing nullcols
      (
      user_id position(1:10),       --不指定分隔符，在列里用position来定位
      user_name position(11:61),
      login_times position(*:73),   -- *号表示开始位置在前一字段的结束位置
      last_login position(*:93) date "yyyy-mm-dd hh24:mi:ss"
      )
 
    b.数据文件的内容为：
   USER_ID USER_NAME                              LOGIN_TIMES LAST_LOGIN
---------- -------------------------------------------------- ----------- -------------------
         1 Unmi                                             3  2009-01-05 20:34:44
         2                                                  5  2008-10-15 0:0:0
         3 mini                                             8  2009-01-02 0:0:0
         4 Kypfos
         5 hello                                            1  2008-12-23 0:0:0

执行一样的命令：
sqlldr sys/oracle@ocm as sysdba control=/user.txt

注意：
1)常规导入是通过使用 INSERT语句来导入数据。Direct导入可以跳过数据库的相关逻辑而直接将数据导入到数据文件中，可以提高导入数据的性能。当然，在很多情况下，不能使用此参数(如果主键重复的话会使索引的状态变成UNUSABLE!)。
2) 通过指定 UNRECOVERABLE选项，可以关闭数据库的日志。这个选项只能和 direct 一起使用。
当加载大量数据时（大约超过10GB），最好抑制日志的产生：
SQL>ALTER TABLE RESULTXT nologging; 这样不产生REDO LOG，可以提高效率。
然后在控制文件中 load data 上面加一行：unrecoverable。此选项必须要与DIRECT共同应用。
3) 对于超大数据文件的导入就要用并发操作了，即同时运行多个导入任务.
sqlldr userid=/ control=result1.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true