一、简介
Sqoop主要是作用于Hadoop上与传统关系型数据库间数据传递,可以将关系型数据库(Oracle、DB2、SQL Server、PG、MySQL)数据导到Hadoop的HDFS上,也可以将HDFS上的数据导到关系型数据库中。
二、常用命令
序号 | 命令 | 功能 |
---|---|---|
1 | import | 将数据导入集群 |
2 | export | 将数据从集群导出 |
3 | create–hive–table | 创建hive表 |
4 | codegen | 获取数据库中某张表数据生成 |
5 | job | 用来生产一个job |
6 | list-databases | 列出所有数据库名 |
7 | list-tables | 列出某个数据库下所有表名 |
8 | version | 查看版本信息 |
9 | help | 查看帮助 |
10 | merge | 将HDFS中不同目录数据合在一起,放在指定目录中 |
三、示例脚本:
batch_date=$1
sqoop import \
--connect jdbc:mysql://host:3306/database \
--username username\
--password 12345678 \
--target-dir /user/hainiu/goods_table/${batch_date}/ \
--delete-target-dir \
--fields-terminated-by "\t" \
--split-by Id \
--query 'select col1,col2,col3 from table_name where $CONDITIONS'```