Sqoop简介及安装与部署

Apache Sqoop是一个用于在Hadoop和RDBMS之间转移数据的工具,它通过MapReduce实现导入导出。本文介绍了Sqoop的工作机制,以及详细的安装步骤,包括上传和解压Sqoop压缩包,配置环境变量,修改sqoop-env.sh文件,添加MySQL JDBC驱动,并验证启动。
摘要由CSDN通过智能技术生成

Apache Sqoop

1、sqoop介绍

Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。由来自于Apache软件基金会提供。
Sqoop工作机制是将导入或导出命令翻译成MapReduce程序来实现。在翻译出的MapReduce中主要对InputFormat和OutputFormat进行定制。

Hadoop生态系统包括:HDFS、HIive、Hbase等
RDBMS体系包括:MySQL、Oracle、DB2等
Sqoop可以理解为:“SQL到Hadoop和Hadoop到SQL”

Sqoop安装

安装Sqoop的前提是已经具备Java和Hadoop的环境

上传Sqoop压缩包并解压缩

tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C ../servers/

配置环境变量

vi /etc/profile.d/sqoop.sh

添加以下内容

export SQOOP_HOME=/export/servers/sqoop-1.4.6.bin__hadoop-2.0.4-alpha
export PATH=$PATH:$SQOOP_HOME/bin

配置文件修改

sqoop-env.sh
cd $SQOOP_HOME/conf
mv sqoop-env-template.sh sqoop-env.sh
vi sqoop-env.sh

添加以下配置

export HADOOP_COMMON_HOME= /export/servers/hadoop-2.7.5 
export HADOOP_MAPRED_HOME= /export/servers/hadoop-2.7.5
export HIVE_HOME= /export/servers/hive

在这里插入图片描述

添加MySql的JDBC驱动包

直接拷贝/${HIVE_HOME}/lib目录下的驱动包
cp /hive/lib/mysql-connector-java-5.1.32.jar $SQOOP_HOME/lib/

或进入/${SQOOP_HOME}/lib通过rz命令上传

验证启动

bin/sqoop list-databases \
--connect jdbc:mysql://localhost:3306/ \
--username root --password hadoop

在这里插入图片描述
本命令会列出所有mysql的数据库。
到这里,整个Sqoop安装工作完成。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值