Sqoop数据导入

本文介绍了Sqoop的功能、工作机制,并详细阐述了如何全量和增量导入MySQL数据到HDFS、Hive及Hive-Hcatalog,包括append和lastmodified模式的增量导入策略。
摘要由CSDN通过智能技术生成

 #博学谷IT技术支持#  

 一、概述

1.1 功能

  • 导入数据:将MySQL、Oracle中的数据导入到Hadoop的HDFS、Hive、HBASE等数据存储系统。
  • 导出数据:从HDFS、Hive中导出数据到关系数据库MySQL等。

1.2 工作机制

  • 将导入或导出命令翻译成MapReduce实现。

1.3 安装测试

 #测试你的sqoop是否能查看MySQL中所有的数据库
 sqoop list-databases \
 --connect jdbc:mysql://hadoop01:3306/ \
 --username root \
 --password 123456

二、数据导入

  • 全量数据:表中的所有数据。
  • 增量数据:上次操作之后至今产生的数据。
  • 数据子集:所有数据中的一部分数据。

2.1 全量导入MySQL数据到HDFS

sqoop import \
-Dorg.apache.sqoop.splitter.allow_text_splitter=true \
--connect jdbc:mysql://192.168.88.80:3306/userdb \
--username root \
--password 123456 \
--target-dir /sqoop/result3 \
--delete-target-dir \
--fields-terminated-by '\t' \
--split-by name \
--table emp \
--m 2

2.2 全量数据导入至Hive

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值