sqoop简单介绍
sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。
sqoop就是一款数据导入导出工具,底层 将 导入导出命令翻译成MR任务, 执行在YARN平台上, 底层是对MR的输入和输出做了定制化操作
导入: 从RDBMS 到 hadoop生态圈的过程
导出: 从hadoop生态圈 到 RDBMS
sqoop的使用方式主要有二种: 原生API 和 hcatalog API
导入到HDFS 采用的原生API
导入到hive 做增量导入, 一般...
原创
2021-02-26 16:00:40 ·
2963 阅读 ·
0 评论