sqoop同步数据实践

本文详细介绍了Sqoop在数据同步中的应用,包括从关系型数据库导入到Hadoop HDFS、Hive和HBase,以及从Hadoop系统导出到关系型数据库。通过实例演示了各种sqoop命令的使用,如导入导出数据、创建Hive表结构以及使用--query和--where语句进行数据筛选。
摘要由CSDN通过智能技术生成

      本章主要介绍了Sqoop在数据同步场景下的应用实践,主要涉及到讲解Sqoop同步数据方面的多种实现方式和功能。Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres)中的数据导进到HadoopHDFS中,也可以将HDFS的数据导进到关系型数据库中。

应用场景:

1、将原有关系数据库(mysql,oracle)的数据同步到大数据平台如hive、hbase。

2、将大数据平台的数据同步到关系型数据库中。

简单应用:表对表的同步。

复杂应用:在同步时可以通过query-sql来指定所要同步的数据。

导入(import)

导入的意思就是将关系数据库的数据导入到HDFS、Hive、HBase中

导入到HIve

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值