Data Pump 反映了整个导出/导入过程的完全革新。不使用常见的 SQL 命令,而是应用专用API(direct path api etc) 来以更快得多的速度加载和卸载数据。
使用EXPDP和IMPDP时应该注意的事项:
EXP和IMP是客户端工具程序,它们既可以在客户端使用,也可以在服务端使用。 EXPDP和IMPDP是服务端的工具程序,他们只能在ORACLE服务端使用,不能在客户端使用。 IMP只适用于EXP导出的文件,不适用于EXPDP导出文件;IMPDP只适用于EXPDP导出的文件,而不适用于EXP导出文件。 expdp或impdp命令时,可暂不指出用户名/密码@实例名 as 身份,然后根据提示再输入,如: expdp schemas=scott dumpfile=expdp.dmp DIRECTORY=dpdata1; 调用 EXPDP使用 EXPDP 工具时,其转储文件只能被存放在 DIRECTORY 对象对应的 OS 目录中,而不能直接指定转储文件所在的 OS 目录.因此,使用 EXPDP 工具时,必须首先建立DIRECTORY 对象.并且需要为数据库用户授予使用 DIRECTORY 对象权限.
一、前期准备,创建并使用逻辑目录[编辑]
1. 创建逻辑目录,该命令不会在操作系统创建真正的目录,最好以system等管理员创建。 create directory dpdata1 as 'd:\test\dump'; 2. 查看管理理员目录(同时查看操作系统是否存在,因为Oracle并不关心该目录是否存在,如果不存在,则出错) select * from dba_directories; 3. 给scott用户赋予在指定目录的操作权限,最好以system等管理员赋予。 grant read,write on directory dpdata1 to scott;
二、导出数据[编辑]
1)按用户导 expdp scott/tiger@orcl schemas=scott dumpfile=expdp.dmp DIRECTORY=dpdata1; 可以导出多个模式,schemas=scott,test 2)并行进程parallel expdp scott/tiger@orcl directory=dpdata1 dumpfile=scott3.dmp parallel=40 job_name=scott3 3)按表名导 expdp scott/tiger@orcl TABLES=emp,dept dumpfile=expdp.dmp DIRECTORY=dpdata1; 对于分区表 expdp scott/tiger@orcl TABLES=emp:par_name,dept:par_name dumpfile=expdp.dmp DIRECTORY=dpdata1; 可以同时导出多个表,用逗号分隔 4)按查询条件导 expdp scott/tiger@orcl directory=dpdata1 dumpfile=expdp.dmp Tables=emp query='WHERE deptno=20'; 5)按表空间导 expdp system/manager DIRECTORY=dpdata1 DUMPFILE=tablespace.dmp TABLESPACES=temp,example; 可以同时导出多个表空间,用逗号分隔 6)导整个数据库 expdp system/manager DIRECTORY=dpdata1 DUMPFILE=full.dmp FULL=y; 7)include/exclude例子: include=table:"in('DB','TS')" 或者 include=table:"like '%E%'" 或者 include=function,package,procedure,table:"='EMP'" 或者 exclude=SEQUENCE,TABLE:"IN ('EMP','DEPT')" 其他常用参数: logfile= 导出数据时的日志文件,记录导出情况 parallel=20 并行导出参数,指定并行的进程数
三、还原数据[编辑]
1)导到指定用户下 impdp scott/tiger DIRECTORY=dpdata1 DUMPFILE=expdp.dmp SCHEMAS=scott; 2)改变表的owner impdp system/manager DIRECTORY=dpdata1 DUMPFILE=expdp.dmp TABLES=scott.dept REMAP_SCHEMA=scott:system; 3)导入表空间 impdp system/manager DIRECTORY=dpdata1 DUMPFILE=tablespace.dmp TABLESPACES=example; 4)导入数据库 impdb system/manager DIRECTORY=dump_dir DUMPFILE=full.dmp FULL=y; 5)追加数据 impdp system/manager DIRECTORY=dpdata1 DUMPFILE=expdp.dmp SCHEMAS=system TABLE_EXISTS_ACTION=append
四、EXPDP 命令行选项[编辑]
编号 | 参数名称 | 说明 |
---|---|---|
1 | ATTACH | 该选项用于在客户会话与已存在导出作业之间建立关联.语法如下 ATTACH=[schema_name.]job_name Schema_name 用于指定方案名,job_name 用于指定导出作业名. 注意,如果使用 ATTACH 选项,在命令行除了连接字符串和 ATTACH 选项外,不能指定任何其他选项,示例如下: Expdp scott/tiger ATTACH=scott.export_job |
2 | CONTENT | 该选项用于指定要导出的内容.默认值为 ALL CONTENT={ALL | DATA_ONLY | METADATA_ONLY} 当设置 CONTENT 为 ALL 时,将导出对象定义及其所有数据.为 DATA_ONLY 时,只导出对象数据, 为 METADATA_ONLY 时, Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump CONTENT=METADATA_ONLY |
3 | DIRECTORY | 指定转储文件和日志文件所在的目录 DIRECTORY=directory_object Directory_object 用于指定目录对象名称.需要注意,目录对象是使用 CREATE DIRECTORY 语句建立的对象,而不是 OS 目录 Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dump 建立目录 CREATE DIRECTORY dump as ‘d:\dump’; 查询创建了那些子目录: SELECT * FROM dba_directories |
4 | DUMPFILE | 用于指定转储文件的名称,默认名称为 expdat.dmp DUMPFILE=[directory_object:]file_name [,….] Directory_object 用于指定目录对象名,file_name 用于指定转储文件名.需要注意,如果不指定 directory_object,导出工具会自动使用 DIRECTORY 选项指定的目录对象 Expdp scott/tiger DIRECTORY=dump1 DUMPFILE=dump2:a.dmp |
5 | ESTIMATE | 指定估算被导出表所占用磁盘空间的方法.默认值是 BLOCKS ESTIMATE={BLOCKS | STATISTICS} 设置为 BLOCKS 时,oracle 会按照目标对象所占用的数据块个数乘以数据块尺寸估算对象占用的空间,设置为 STATISTICS 时,根据最近统计值估算对象占用空间 Expdp scott/tiger TABLES=emp ESTIMATE=STATISTICS DIRECTORY=dump DUMPFILE=a.dump |
6 | ESTIMATE_ONLY | 指定是否只估算导出作业所占用的磁盘空间,默认值为 N ESTIMATE_ONLY={Y | N} 设置为 Y 时,导出作用只估算对象所占用的磁盘空间,而不会执行导出作业,为 N 时,不仅估算对象所占用的磁盘空间,还会执行导出操作. Expdp scott/tiger ESTIMATE_ONLY=y NOLOGFILE=y |
7 | EXCLUDE | 该选项用于指定执行操作时释放要排除对象类型或相关对象 EXCLUDE=object_type[:name_clause] [,….] Object_type 用 于 指 定 要 排 除 的 对 象 类 型 ,name_clause 用 于 指 定 要 排 除 的 具 体 对 象 . EXCLUDE 和 INCLUDE 不能同时使用 Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dup EXCLUDE=VIEW |
8 | FILESIZE | 指定导出文件的最大尺寸,默认为 0,(表示文件尺寸没有限制) |
9 | FLASHBACK_SCN | 指定导出特定 SCN 时刻的表数据 FLASHBACK_SCN=scn_value Scn_value 用于标识 SCN 值.FLASHBACK_SCN 和 FLASHBACK_TIME 不能同时使用 Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_SCN=358523 |
10 | FLASHBACK_TIME | 指定导出特定时间点的表数据 FLASHBACK_TIME=”TO_TIMESTAMP(time_value)” Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp FLASHBACK_TIME=“TO_TIMESTAMP(’25-08-2004 14:35:00’,’DD-MM-YYYY HH24:MI:SS’)” |
11 | FULL | 指定数据库模式导出,默认为 N FULL={Y | N} 为 Y 时,标识执行数据库导出. |
12 | HELP | 指定是否显示 EXPDP 命令行选项的帮助信息,默认为 N 当设置为 Y 时,会显示导出选项的帮助信息. Expdp help=y |
13 | INCLUDE | 指定导出时要包含的对象类型及相关对象 INCLUDE = object_type[:name_clause] [,… ] |
14 | JOB_NAME | 指定要导出作业的名称,默认为 SYS_XXX JOB_NAME=jobname_string |
15 | LOGFILE | 指定导出日志文件文件的名称,默认名称为 export.log LOGFILE=[directory_object:]file_name Directory_object 用于指定目录对象名称,file_name 用于指定导出日志文件名. 如果不指定 directory_object.导出作业会自动使用 DIRECTORY 的相应选项值. Expdp scott/tiger DIRECTORY=dump DUMPFILE=a.dmp logfile=a.log |
16 | NETWORK_LINK | 指定数据库链名,如果要将远程数据库对象导出到本地例程的转储文件中,必须 设置该选项. |
17 | NOLOGFILE | 该选项用于指定禁止生成导出日志文件,默认值为 N. |
18 | PARALLEL | 指定执行导出操作的并行进程个数,默认值为 1 |
19 | PARFILE | 指定导出参数文件的名称 PARFILE=[directory_path] file_name 编辑参数文件: 除了用户名口令以外的参数,都可以放在parfile中, 每个参数一行 |
20 | QUERY | 用于指定过滤导出数据的 where 条件 QUERY=[schema.] [table_name:] query_clause Schema 用于指定方案名,table_name 用于指定表名,query_clause 用于指定条件限制子句.QUERY 选项不能与 CONNECT=METADATA_ONLY,ESTIMATE_ONLY,TRANSPORT_TABLESPACES等选项同时使用. Expdp scott/tiger directory=dump dumpfiel=a.dmp Tables=emp query=’WHERE deptno=20’ |
21 | SCHEMAS | 该方案用于指定执行方案模式导出,默认为当前用户方案. |
22 | STATUS | 指定显示导出作业进程的详细状态,默认值为 0 |
23 | TABLES | 指定表模式导出 TABLES=[schema_name.]table_name[:partition_name][,…] Schema_name 用于指定方案名,table_name 用于指定导出的表名,partition_name 用于指定要导出的分区名. |
24 | TABLESPACES | 指定要导出表空间列表 |
25 | TRANSPORT_FULL_CHECK | 该选项用于指定被搬移表空间和未搬移表空间关联关系的检查方式,默认为 N. 当 设置为 Y 时,导出作业会检查表空间直接的完整关联关系,如果表所在表空间或其索引所在的表空间只有一个表空间被搬移,将显示错误信息. 当设置为N 时, 导出作业只检查单端依赖,如果搬移索引所在表空间,但未搬移表所在表空间,将显示出错信息,如果搬移表所在表空间,未搬移索引所在表空间,则不会显示错误信息. |
26 | TRANSPORT_TABLESPACES | 指定执行表空间模式导出 |
27 | VERSION | 指定被导出对象的数据库版本,默认值为 COMPATIBLE. VERSION={COMPATIBLE | LATEST | version_string} 为 COMPATIBLE 时,会根据初始化参数 COMPATIBLE 生成对象元数据;为 LATEST 时,会根据数据库的实际版本生成对象元数据.version_string 用于指定数据库版本字符串. |
五、导入导出过程的监控[编辑]
DBA_DATAPUMP_JOBS:查看导出进程正在运行
DBA_DATAPUMP_SESSIONS:查看导出jobs的状态
V$SESSION_LONGOPS:获取其他有用信息来预测导出作业完成的时间。
六、 导入导出过程终止[编辑]
impdp和expdp不能通过ctrl+c来结束。 ctrl+c会返回到impdp或者expdp的命令提示符状态。 然后执行stop 或者stop=immediate 才能真正停止相关的jobs
或者通过attach参数,连接到指定的job中,在执行stop命令停止相关作业。 否则后续的作业会等待之前的作业执行完成后,才能继续执行。