写在前面一:
本文总结“Hadoop生态系统”中的其中一员——Apache Sqoop,本着“最简洁、最有力”的博文原则,话不多说,直入正文
写在前面二:
环境说明:
一、什么是Apache Sqoop
官网最有力:Apache Sqoop™ is a tool designed for efficiently transferringbulk data between ApacheHadoopandstructured datastoressuch as relational databases.
我的理解:使用Sqoop进行数据的导入、导出,其本质上是运行Mapreduce程序,充分利用了MR的并行化和容错性。
加粗样式
二、Sqoop安装配置
2.1、下载Sqoop
http://sqoop.apache.org/
2.2、解压缩
cd /home/yujianxin/sqoop
tar -zxvf sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz
2.3、配置Sqoop环境变量
三、整合Sqoop与MySQL
拷贝mysql-connector-java-5.1.10.jar到$SQOOP_HOME/lib下
四、验证Sqoop安装是否成功
总结使用Sqoop将HDFS/Hive/HBase中的数据与MySQL/Oracle中的数据进行导入、导出操作。