Sqoop 简介:
Apache Sqoop™ 是一种旨在有效地在 Apache Hadoop 和诸如关系数据库等结构化数据存储之间传输大量数据的工具。
Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。
请注意,1.99.7与1.4.6不兼容,且没有特征不完整,它并不打算用于生产部署。
Sqoop 原理:
将导入或导出命令翻译成 mapreduce 程序来实现。
在翻译出的 mapreduce 中主要是对 inputformat 和 outputformat 进行定制。
Sqoop 安装:
1、下载地址:http://apache.forthnet.gr/sqoop/1.4.7/
2、上传安装包到 Linux 中 /opt/software/ :sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
3、解压 Sqoop 安装包到指定目录:tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/
4、重命名配置文件:mv sqoop-env-template.sh sqoop-env.sh
5、修改配置文件:vi sqoop-env.sh
export HADOOP_COMMON_HOME=/opt/module/hadoop-2