目录
一、Sqoop概述
Sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具,可以将关系型数据库(MySQL,Oracle等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导出到关系型数据库中。
二、Sqoop工作原理
Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现抽取、转换、加载。MapReduce天生的特性保证了并行化和高容错率,而且相比Kettle等传统ETL工具,任务跑在Hadoop集群上,减少了ETL服务器资源的使用情况。在特定场景下,抽取过程会有很大的性能提升。