为什么使用sqoop?
1、对于hadoop数据的处理有时候要用户关系型数据库(mysql,oracle)中的数据进行清洗,或处理的数据需要导入到关系型数据库中;
2、由于没有工具的支持hadoop的hdfs和数据库之间的交互,手工写map-reduce中来处理复杂繁琐,维护成功高。
3、sqoop是连接关系型数据库和hadoop的桥梁,主要有两个方面(导入和导出);
开始部署sqoop
1、下载sqoop-1.4.7的sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
路径:https://downloads.apache.org/sqoop/1.4.7/
2、部署sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
a、解压sqoop包 tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz ,并重命名sqoop-1.4.7
b、修改sqoop配置文件,进入sqoop-1.4.7/conf目录 ;复制 sqoop-env-template.sh文件为sqoop-env.sh,并修改改文件中 HADOOP_COMMON_