Sqoop简介
Sqoop全称SQL to Hadoop,主要用于Hadoop与SQL(这里的SQL指关系型数据库)进行数据的传递。可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS中的数据导入到关系型数据库中。
Sqoop本身就是作为Hadoop的一个第三方模块存在,后来为了方便迭代才作为一个单独的Apache项目存在。
Sqoop1中1.4.7(不包含1.4.7)之前的版本用于CentOS6版本,1.4.7(包含1.4.7)用于CentOS7版本。Sqoop2用于测试,不用于生产。
Sqoop原理
Sqoop的本质是MapReduce,主要对InputFormat和OutputFormat进行了定制。
注意:专栏中使用Sqoop1.4.6