SQOOP 是hadoop生态圈中使用较为简单的一款产品;
- (1)SQOOP 命令是转换为 map 任务执行的,再次可见hadoop(hdfs、MapReduce)居于hadoop生态圈的核心位置
- (2)关系型数据库向hadoop的转换应当是双向的;
SQOOP 用于对数据进行导入导出的,
(1)把 MySQL、Oracle 等数据库中的数据导入到 HDFS、Hive、HBase中
(2)把HDFS、Hive、HBase中的数据导出到MySQL、Oracle等数据库中
也即,SQOOP 架起了一个连接关系型数据库和 HDFS 的桥梁;
当关系型数据库存放的数据很大时,执行效率会很低,需要切换到hadoop上操作;当我们在 hadoop 上处理和分析完这些数据时,需要将分析的结果导出到传统的关系型数据库上。(hadoop的功能其实在大数据的分析)
安装
下载 ⇒ 解压 ⇒ 设置环境变量 ⇒ 重新编译profile
文件