最近有人问我说,使用sqlldr进行直接路径加载时添加并行参数parallel=true后,并没有发现数据加载效率提高多少.[@more@]我先是怀疑机器不是多cpu的,但对方机器有8个cpu;后来仔细查看文档才知道参数parallel并不是让一个sqlldr语句起多个进程来加载数据,而是不锁住加载表,允许别的直接路径加载. 所以要使parallel起作用,应该先将要加载的数据文件分成多个,用多个sqlldr语句同时加载,如下例:
sqlldr userid=scott/tiger control=load1.ctl data=data1.txt direct=y parallel=true &
sqlldr userid=scott/tiger control=load2.ctl data=data2.txt direct=y parallel=true &
sqlldr userid=scott/tiger control=load3.ctl data=data3.txt direct=y parallel=true &
不过tom kyte曾经提过另外一种不用分拆文件又能同时用到并行的方法:即使用外部表技术(版本9i之后),将数据文件映射成一个虚表(例如demo),然后进行并行创建,如:
create /*+ nologging */ table demo2 as select /*+ parallel(demo,8) */* from demo;