Sqoop Import HDFS

本文详细介绍了使用Sqoop从MySQL数据库导入数据到Hadoop的多种场景,包括密码访问方式、全表导入、并行度控制、字段分隔符设置、增量导入、压缩启用、空值处理、部分数据导入等高级技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Sqoop Import 应用场景——密码访问

明码访问

sqoop list-databases \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

--password xxx

交互式密码

sqoop list-databases \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

-p

文件授权密码

sqoop list-databases \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

--password-file /user/hadoop/.password

Sqoop Import 应用场景——导入全表

不指定目录

sqoop import \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

--password-file /user/hadoop/.password \

--table test_user

不指定目录

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user

指定目录

sqoop import \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user

目录已存在

sqoop import \

--connect jdbc:mysql://xxx.xxx.xxx.xxx/test \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

--delete-target-dir

Sqoop Import 应用场景——控制并行度

控制并行度

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1

Sqoop Import 应用场景——控制字段分隔符

控制字段分隔符

sqoop import \

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@"

Sqoop Import 应用场景——增量导入

手动增量导入

sqoop import \

--connect 'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/djt_user \

-m 1 \

--fields-terminated-by "@" \

--append \

--check-column 'id' \

--incremental append \

--last-value 3

自动增量导入

sqoop job \

--create job_import_test_user \

--connect 'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

-m 1 \

--fields-terminated-by "@" \

--append \

--check-column 'id' \

--incremental append \

--last-value 6

sqoop job --exec job_import_test_user

Sqoop Import 应用场景——启动压缩

启动压缩

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@" \

-z

Sqoop Import 应用场景——导入空值处理

导入空值处理

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@" \

--null-non-string "###" \

--null-string "###"

Sqoop Import 应用场景——导入部分数据

使用–columns

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--columns id,name \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@" \

--null-non-string "###" \

--null-string "###"

使用–where

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--table test_user \

--where "sex='female'" \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@" \

--null-non-string "###" \

--null-string "###"

使用–query

sqoop import \

--connect

'jdbc:mysql://xxx.xxx.xxx.xxx/test?useUnicode=true&characterEncoding=utf-8' \

--username root \

--password-file /user/hadoop/.password \

--query "select * from test_user where age<=30 and \$CONDITIONS" \

--target-dir /sqoop/test/test_user \

--delete-target-dir \

-m 1 \

--fields-terminated-by "@" \

--null-non-string "###" \

--null-string "###"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值