Sqoop 简介:
Apache Sqoop™ 是一种旨在有效地在 Apache Hadoop 和诸如关系数据库等结构化数据存储之间传输大量数据的工具。
Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。
请注意,1.99.7与1.4.6不兼容,且没有特征不完整,它并不打算用于生产部署。
Sqoop 原理:
将导入或导出命令翻译成 mapreduce 程序来实现。
在翻译出的 mapreduce 中主要是对 inputformat 和 outputformat 进行定制。
Sqoop 安装:
1、下载地址:http://apache.forthnet.gr/sqoop/1.4.7/
2、上传安装包到 Linux 中 /opt/software/ :sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
3、解压 Sqoop 安装包到指定目录:tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/
4、重命名配置文件:mv sqoop-env-template.sh sqoop-env.sh
5、修改配置文件:vi sqoop-env.sh
export HADOOP_COMMON_HOME=/opt/module/hadoop-2

Apache Sqoop是一个用于高效地在Hadoop和关系数据库间传输数据的工具,孵化自2012年,现为Apache顶级项目。本文介绍了Sqoop的基本原理,其通过翻译成mapreduce任务实现导入导出,特别强调了1.99.7版本的不兼容性和非生产环境使用。同时,详述了Sqoop的安装步骤,包括下载、上传、解压、配置环境变量、添加jdbc驱动以及测试数据库连接。
最低0.47元/天 解锁文章
975

被折叠的 条评论
为什么被折叠?



