sqoop使用与原理

本文详细介绍了Sqoop的使用,包括其安装配置、数据库到HDFS的数据导入、HDFS到数据库的数据导出、与Hive的交互以及 Sqoop 的工作原理。此外,还涵盖了配置MySQL远程连接和MapReduce参数在Sqoop中的应用,通过实例进行了深入讲解。
摘要由CSDN通过智能技术生成

1、sqoop简介

    sqoop是一个用来将hadoop中hdfs和关系型数据库中的数据相互迁移的工具,可以将一个关系型数据库(mysql、oracle等)中的数据
    导入到hadoop的hdfs中,也可以将hdfs的数据导入到关系型数据库中。

2、sqoop的特点:

    sqoop的底层实现是mapreduce,所以sqoop依赖于hadoop,数据是并行导入的。

3、sqoop的安装和配置

    1)安装:

          解压缩sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz,修改/etc/profile 将sqoop_home加入其中
         因为要链接数据库,所以要将数据库的驱动jar包拷贝到sqoop的lib文件夹子下

    2)配置:

         重命名配置文件
               mv sqoop-env-template.sh sqoop-env.sh
         修改文件内容(也可以不修改):
          #Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/usr/local/hadoop/

#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/usr/local/hadoop

#set the path to where bin/hbase is available
export HBASE_HOME=/usr/local/hbase

#Set the path to where bin/hive is available
export HIVE_HOME=/usr/local/hive

#Set the path for where zookeper config dir is
export ZOOCFGDIR=/usr/local/zk

4.sqoop的使用:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值