Sqoop

最新推荐文章于 2022-05-04 21:18:57 发布

yongfeicao

最新推荐文章于 2022-05-04 21:18:57 发布

阅读量809

点赞数

分类专栏： Sqoop

本文链接：https://blog.csdn.net/QJQJLOVE/article/details/107291458

版权

Sqoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、RDBMS到HDFSRDBMS到HDFS

全部导入

$ bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/zoo \
--username root \
--password 111111 \
--table staff \
--target-dir /user/zoo \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t"

查询导入

bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/zoo \
--username root \
--password 000000 \
--target-dir /user/zoo \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--query 'select name,sex from staff where id <=1 and $CONDITIONS;'


must contain '$CONDITIONS' in WHERE clause.
如果query后使用的是双引号，则$CONDITIONS前必须加转移符，防止shell识别为自己的变量。

导入指定列

bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/company \
--username root \
--password 000000 \
--target-dir /user/company \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--columns id,sex \
--table staff


columns中如果涉及到多列，用逗号分隔，分隔时不要添加空格

使用sqoop关键字筛选查询导入数据

$ bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/company \
--username root \
--password 000000 \
--target-dir /user/company \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--table staff \
--where "id=1"

2、RDBMS到Hive

$ bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/company \
--username root \
--password 000000 \
--table staff \
--columns "id,name,sex" \
--column-family "info" \
--hbase-create-table \
--hbase-row-key "id" \
--hbase-table "hbase_company" \
--num-mappers 1 \
--split-by id

HBase需要手动创建HBase表

3、导出数据（HIVE/HDFS到RDBMS）

$ bin/sqoop export \
--connect jdbc:mysql://hadoop102:3306/company \
--username root \
--password 000000 \
--table staff \
--num-mappers 1 \
--export-dir /user/hive/warehouse/staff_hive \
--input-fields-terminated-by "\t"

Mysql中如果表不存在，不会自动创建

yongfeicao

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Sqoop

Sqoop主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。
复制链接

扫一扫