1、配置源和目标的数据连接
源(oracle):
目标(Hive 2.1.1)
系统自带2.1.1的驱动jar包,如果该版本无法兼容你的Hive,可将对应版本hive驱动jar包导入HHDI的lib目录中。
自带的jar包包括以下文件:
hadoop-common-2.6.0.jar
hive-common-2.1.0.jar
hive-jdbc-2.1.0.jar
hive-metastore-2.1.0.jar
hive-serde-2.1.0.jar
hive-service-2.1.0.jar
hive-service-rpc-2.1.0.jar
hive-shims-2.1.0.jar
2、配置数据抽取任务,设定源和目标
源页签:
选择源数据连接和源表,生成查询语句,默认抽取该表中的所有字段和所有记录(20w条记录)