大数据技能01: Sqoop

面试考点

  1. Sqoop 底层生成的 MapReduce 程序只有 MapTask,没有 ReduceTask。默认开启 4 个 MapTask。

注意点

  1. Sqoop1 和 Sqoop2 不兼容

基本原理

将命令转换成 MapReduce 程序

导入和导出的概念

1、导入: 从非大数据集群向大数据集群中传输数据,使用 import 关键字
2、导出: 从大数据集群向非大数据集群中传输数据

案例1: MySQL -> HDFS

全量导入

1、MySQL 参数

序号 参数 参数值 含义
1 –connect jdbc:mysql://hadoop102:3306/gmall
2 –username root
3 –password
4 –table user_info MySQL 中的表格

2、HDFS 参数

序号 参数 参数值 含义
1 –target-dir /test HDFS路径
2 –delete-target-dir 路径存在会报错
3 –num-mappers 默认为 4 个
4 –fields-terminated-by 默认为 ‘\001’,注意 MySQL 中的数据分隔符是否与指定的分隔符相同

3、Shell 脚本

bin/sqoop import \
--connect jdbc:mysql://hadoop102:3306/gmall \
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值