一、概述
Sqoop 是 Apache 旗下一款“ Hadoop 和关系数据库服务器之间传送数据 ”的工具,实现大数据平台与关系型数据库之间的数据迁移。
导入 import:关系型数据库导入数据到大数据平台
导出 export:大数据平台数据导出到关系型数据库
Sqoop的本质是一个命令行工具,将数据迁移的命令转化为MR程序。传统MR程序的输入输出都是HDFS,Sqoop底层只需重新定义输入 InputFormat 和输出 OutputFormat,以实现从关系型数据库读取数据和向关系型数据库写入数据。
二、安装
安装包下载地址:Index of /dist/sqoophttp://archive.apache.org/dist/sqoop/
安装步骤:
1、下载安装包并解压
2、进入conf目录,将sqoop-env-template.sh修改为sqoop-env.sh
mv sqoop-env-template.sh sqoop-env.sh
3、修改sqoop-env.sh
写入HADOOP_COMMON_HOME、HADOOP_MAPRED_HOME
HBASE_HOME、HIVE_HOME、ZOOCFGDIR
其中 ZOOCFGDIR 的路径是Zookeeper的conf目录
export ZOOCFGDIR=/home/hadoop/apps/zookeeper-3.4.10/conf
4、将mysql驱动包添加到 lib 目录下
5、配置环境变量
6、验证 sqoop version
三、Sqoop的基本命令
sqoop help 查看 sqoop 支持哪些命令