Sqoop初体验

本文详细介绍了Sqoop的工作机制,以及如何进行数据导入和导出。Sqoop是用于在Hadoop和RDBMS之间转移数据的工具,支持全量和增量导入。在导入时,可以通过指定不同模式实现数据的追加或更新。导出则提供了多种模式,如默认的INSERT、UPDATE和存储过程调用。通过Sqoop,可以高效地管理Hadoop和关系型数据库之间的数据流转。
摘要由CSDN通过智能技术生成

Sqoop介绍

Sqoop 工作机制是将导入或导出命令翻译成 mapreduce 程序来实现。在翻译出的 mapreduce 中主要是对 inputformat 和 outputformat 进行定制.

Hadoop 生态系统包括: HDFS、 Hive、 Hbase 等
RDBMS 体系包括: Mysql、 Oracle、 DB2 等
Sqoop 可以理解为: “SQL 到 Hadoop 和 Hadoop 到 SQL”


                                        站在 Apache 立场看待数据流转问题, 可以分为数据的导入导出:
Import: 数据导入。 RDBMS----->Hadoop
Export: 数据导出。 Hadoop---->RDBMS


Sqoop 导入

导入语法:sqoop import (generic-args) (import-args)

全量导入从Mysql导入HDFS
bin/sqoop import \
--connect jdbc:mysql://node-1:3306/userdb \  -- 指定mysql 数据库
--username root \    -- mysql账户
--password hadoop \   -- mysql账户密码
--delete-target-dir \  -- 若目录已存在,删除目标目录
--target-dir /sqoopresult \  -- 指定上传hdfs目录
--table emp --导出userdb数据库中的emp表

增量导入</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值