数据迁移工具 sqoop 安装部署及实战

目录

  • 概述
  • 工作机制
  • 安装部署
  • 实战

1.概述

sqoop是apache旗下一款Hadoop和关系数据库服务器之间传送数据的工具。

  • 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统;
  • 导出数据从Hadoop的文件系统中导出数据到关系数据库。

2.工作机制

       将导入或导出命令翻译成mapreduce程序来实现,在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。其实就是将导入导出命令转化为mapreduce程序来执行,sqoop在接收到命令后,都要生成mapreduce程序,使用sqoop的代码生成工具可以方便查看到sqoop所生成的java代码,并可在此基础之上进行深入定制开发。

3.安装部署

  • 软件准备

安装sqoop的前提是已经具备java和hadoop的环境;

最新版下载地址http://ftp.wayne.edu/apache/sqoop/1.4.6/

  • 修改配置文件

$ cd $SQOOP_HOME/conf

$ mv sqoop-env-template.sh sqoop-env.sh

打开sqoop-env.sh并编辑下面几行:

export HADOOP_COMMON_HOME=/home/hadoop/apps/hadoop-2.6.1/

export HADOOP_MAPRED_HOME=/home/hadoop/apps/hadoop-2.6.1/

export HIVE_HOME=/home/hadoop/apps/hive-1.2.1

  • 加载驱动

 $ cp  ~/app/hive/lib/mysql-connector-java-5.1.28.jar   $SQOOP_HOME/lib/

  • 启动

$ cd $SQOOP_HOME/bin

$ sqoop-version

 

4 .实战

  • import :

(1)从mysql数据库 urldb中的url_rule表,导入 HDFS:

$bin/sqoop import   \

--connect jdbc:mysql://shizhan01:3306/urldb   \

--username root  \

--password root   \

--table url_rule\

--m 1

(2)从mysql数据库 urldb中的url_rule表,导入 Hive:

$bin/sqoop import   \

--connect jdbc:mysql://shizhan01:3306/urldb   \

--username root  \

--password root   \

--table url_rule  \

--hive-import  \

--m 1

  • export :从HDFS导入数据库, 注意提前在数据库中建立表结构。

bin/sqoop export \

--connect jdbc:mysql://shizhan01:3306/db \

--username root \

--password root \

--table employee \

--export-dir /queryresult

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值