简介
主要用于在 Hadoop(Hive) 与传统的数据库 ( mysql、postgresql... ) 间进行数据的传递
可以将一个关系型数据库(例如 : MySQL, Oracle, Postgres 等)中的数据导进到 Hadoop 的 HDFS 中,也可以将 HDFS 的数据导进到关系型数据库中
最新的稳定版本是 1.4.7
这里使用 centos6.8 与 Sqoop 1.4.6, centos6.8 与 Sqoop 1.4.7 存在不兼容, 而 centos 与 Sqoop 1.4.7 不存在此问题.
sqoop 的本质就是迁移数据, 迁移的方式:把 sqoop 的迁移命令转换成 MapReduce 程序
相关组件:HDFS, MapReduce, YARN, ZooKeeper, Hive, HBase, MySQL
配置
1.下载, 上传, 解压 不再赘述
2. 配置 sqoop.env.sh
#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/opt/module/hadoop-2.7.2
#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/opt/module/hadoop-2.7.2
#set the path to where bin/hbase is available
export HBASE_HOME=/opt/module/hbase-1.3.2.1
#Set the path to where bin/hive is available
export HIVE_HOME=/opt/module/hive