前言:
Sqoop是一个用于在Apache Hadoop和结构化数据存储(如关系数据库)之间传输数据的工具。它允许用户通过简单的命令将数据从关系数据库导入到Hadoop分布式文件系统(HDFS)、Hive或HBase中,或者将数据从Hadoop导出到关系数据库。Sqoop的工作原理是通过使用数据库的JDBC驱动程序与数据库进行通信,从而实现数据的导入和导出。
一、前期工作准备
1、启动Hadoop完全分布式
start-all.sh
2、查看hdfs和yarn页面端口是否能够正常访问
hdfs端口:你的IP地址:9870
yarn端口:你的IP地址:8088
二、Sqoop环境的部署
1、上传sqoop压缩包到Linux对应的目录下
注:这个目录根据自己的来,尽量创建一个software的目录,将软件包都放在这个目录下。
2、解压sqoop压缩包
tar -zxvf sqoop压缩包
3、解压完成很查看一下sqoop包下含有的文件
#切到对应目录下
cd sqoop解压后的名字
#查看
ll
4、将MySQL的驱动jar包复制到sqoop包下的lib依赖库中
cp mysql-connect-jar-5.1.32.jar sqoop/lib/
5、配置sqoop的环境变量
vim ./.bash_profile
注:配置后,记得source ./.bash_profile。
6、创建sqoop的核心文件sqoop-env.sh(用里面的模板进行创建)
cp sqoop-env-template.sh sqoop-env.sh
7、编辑核心文件sqoop-env.sh
vim sqoop-env.sh
8、查看sqoop版本
sqoop version
9、查看一下sqoop帮助命令检查sqoop是否安装成功
sqoop help
到此,sqoop环境的安装部署就完成了。