数据迁移工具sqoop简介

注:以下资料参考迪伦老师整理

一 sqoop是什么?

Sqoop是一款开源的工具,Sqoop 即 SQL to Hadoop 主要用于在HADOOP(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,发展至今主要演化了二大版本,Sqoop1和Sqoop2

二 为什么选择Sqoop?

1,高效可控的利用资源,可以指定任务并行度,指定超时时间;
2,数据类型映射与转化,可自动进行,用户也可自定义;
3,支持多种主流数据库,MySQL,Oracle,SQL Server,DB2等。

三 Sqoop1和Sqoop2区别

1,两个不同的版本,完全不兼容;
2,版本号划分区别    Apache:1.4.x,1.99.x
                    CDH: sqoop-1.4.3-cdh4,sqoop2-1.99.2-cdh4.5.0 
3,sqoop2比sqoop1的改进 

 (1)引入sqoop server,集中化管理connector等;
 (2)多种访问方式:CLI,Web UI,REST API;
  (3) 引入基于角色 的安全机制。 

4,sqoop2和sqoop1架构比较



sqoop1与sqoop2的优缺点

sqoop1优点:架构部署简单。 
sqoop2优点:多种交互方式,命令行,web UI,rest API,conncetor集中化管理,所有的链接安装在sqoop server上,完善权限管理机制,connector规范化,仅仅负责数据的读写。 

sqoop1缺点:命令行方式容易出错,格式紧耦合,无法支持所有数据类型,安全机制不够完善,例如密码暴漏; 
            安装需要root权限,connector必须符合JDBC模型。
sqoop2缺点:架构稍复杂,配置部署更繁琐。
 


稍后将记录Sqoop2的安装和使用!


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值