一、Sqoop的版本
Sqoop目前有两大版本,Sqoop1和Sqoop2,这两个版本都是一直在维护者的,所以使用哪个版本都可以。
这两个版本我都用过,还是感觉Sqoop1用起来比较方便,使用Sqoop1的时候可以将具体的命令全部都写到脚本中,这样看起来是比较清晰的,但是有一个弊端,就是在操作MySQL的时候,MySQL数据库的用户名和密码会明文暴露在这些脚本中,不过一般也没有什么问题,因为在访问生产环境下的MySQL的时候,是需要申请权限的,就算你知道了MySQL的用户名和密码,但是你压根无法访问MySQL的那台机器,所以这样也是安全的,只要运维那边权限控制到位了就没问题。
sqoop2中引入了sqoop server(服务),集中管理connector(连接),而sqoop1只是客户端工具。
相对来说,Sqoop1更加简洁,轻量级。
Sqoop1的最后更新时间是2018年
Sqoop2的最后更新时间是2016年
Sqoop2我之前在使用的时候发现里面bug还是比较多的,相对来说Sqoop1更加稳定一些。
所以在这我们采用Sqoop1。
二、下载
sqoop-1.4.7.bin__hadoop-2.6.0.tar百度网盘地址: