数据传输工具-Sqoop

本文介绍了Sqoop工具在Hadoop和关系型数据库间进行数据传输的应用,包括全量抽取和增量抽取的场景。全量抽取是直接将数据库所有数据抽取,而增量抽取则基于时间戳等方式抽取自上次抽取后的新数据。
摘要由CSDN通过智能技术生成

一、背景

在实际开发场景中,数据需要在Hadoop和关系型数据库之间来回传输,可以使用Sqoop工具来实现。
例如,源数据存储在MySQL或者Oracle关系型数据库中,需要将源数据抽取到HDFS或者Hive中,又或者结果数据存储在HDFS或者Hive中,需要将结果数据加载到MySQL或者Oracle关系型数据库中,这些场景均可以由Sqoop工具实现。
数据抽取的时候涉及到两种方式,一种是全量抽取,另一种是增量抽取。

二、场景一:全量抽取

全量抽取理解起来比较简单,就是将数据库中的源数据直接全部抽取。
例:

源数据
源数据

执行抽取脚本

import
--connect
jdbc:mysql://master/sqoop_test
--username
root
--password
root
--query
"SELECT field_1,field_2,field_3 FROM sqoop_test.table_A where $CONDITIONS"
--target-dir
/user/hive/warehouse/sqoop_test_ods.db/table_a
--fields-terminated-by
"\t"
--delete-target-dir
-m
1

脚本执行
查询结果

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值