一、 Apache Sqoop
1、sqoop介绍:Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。
Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。
Hadoop生态系统包括:HDFS、Hive、Hbase等
RDBMS体系包括:Mysql、Oracle、DB2等
Sqoop可以理解为:“SQL 到 Hadoop 和 Hadoop 到SQL”。
2、 sqoop安装
安装sqoop的前提是已经具备java和hadoop的环境。
配置文件修改:
cd $SQOOP_HOME/conf
mv sqoop-env-template.sh sqoop-env.sh
vi sqoop-env.sh
export HADOOP_COMMON_HOME=/export/servers/hadoop-2.7.5
export HADOOP_MAPRED_HOME=/export/servers/hadoop-2.7.5
export HIVE_HOME=/export/servers/hive
加入mysql的jdbc驱动包
cp/hive/lib/mysql-connector-java-5.1.32.jar $SQOOP_HOME/lib/
验证启动
bin/sqoop list-databases
–connect jdbc:mysql://localhost:3306/
–username root --password hadoop
本命令会列出所有mysql的数据库。
到这里,整个Sqo