1、sqoop简介
sqoop是一个用来将hadoop中hdfs和关系型数据库中的数据相互迁移的工具,可以将一个关系型数据库(mysql、oracle等)中的数据
导入到hadoop的hdfs中,也可以将hdfs的数据导入到关系型数据库中。
2、sqoop的特点:
sqoop的底层实现是mapreduce,所以sqoop依赖于hadoop,数据是并行导入的。
3、sqoop的安装和配置
1)安装:
解压缩sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz,修改/etc/profile 将sqoop_home加入其中
因为要链接数据库,所以要将数据库的驱动jar包拷贝到sqoop的lib文件夹子下
2)配置:
重命名配置文件
mv sqoop-env-template.sh sqoop-env.sh
修改文件内容(也可以不修改):
#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/usr/local/hadoop/
#Set path to where hadoop-*-core.jar is availableexport HADOOP_MAPRED_HOME=/usr/local/hadoop
#set the path to where bin/hbase is availableexport HBASE_HOME=/usr/local/hbase
#Set the path to where bin/hive is availableexport HIVE_HOME=/usr/local/hive
#Set the path for where zookeper config dir isexport ZOOCFGDIR=/usr/local/zk