sqoop复习01
Sqoop是apache旗下一款“hadoop和关系型数据库服务器之间传送数据”的工具。
导入数据:Mysql、Oracle导入数据到Hadoop的HDFS、Hive、Hbase等数据存储系统;
导出数据;从Hadoop的文件系统中导出数据到关系型数据库中
原理:将导入导出命令翻译成mapreduce程序来实现,在翻译出的MapReduce中主要是对inputformat和outputformat进行定制。
sqoop导入:
1、全量导入
1.1、mysql->hdfs
1.2、mysql->hive
1.3、导入表数据子集
2、增量导入
2.1、append模式
2.2、lastmodified模式
2.2.1、append模式
2.2.2、merge-key模式