Sqoop 是一个设计用于在 Apache Hadoop 和结构化数据存储(如关系数据库)之间高效地传输大批量数据的工具。
从oracle全量数据迁移到hdfs
oracle无法进行多表导入hdfs 小编琢磨了很久 决定写一个脚本 循环导入 再调用sqoop命令 看以下操作:
一、明确小编使用组件以及版本
CDH-5.15.0-1.cdh5.15.0.p0.21
sqoop1
oracle
二、sqoop将oralce多表同时向hdfs全量导入脚本编写
下面展示一个 小编自己配置的脚本
。
// 直接上脚本
#!/bin/sh
#sqoop执行路径
export sqoop_path=/opt/cloudera/parcels/CDH-5.15.0-1.cdh5.15.0.p0.21/bin
#自定义的日志输出文件
export sqoop_logs=/var/log/sqoop.log
#检测该路径是否存在
#
if [ ! -e ${sqoop_path} ]
then
exit
else
echo "Directory exists !" >> $sqoop_logs
fi
#
#oracle数据库表 放你所有