Sqoop理论知识:介绍-产生背景-架构-数据导入导出流程

一、简介

Sqoop是一个数据迁移工具。是一个MapReduce的代码框架。
可以实现 数据在 关系型数据库 和 Hadoop 之间的相互 导入和导出。 

二、产生背景

对于 关系型数据库 和 Hadoop(HDFS/Hive/HBase) 之间的数据传递,
我们通常的解决方案是: 根据不同的需求来编写MapReduce来完成。
但是这种方案存在明显的局限性:我们每次都需要编写MR,学习成本高,使用也不方便。
于是诞生了一种MR的代码框架,即Sqoop。有了它以后,我们无需再编写MapReduce代码,只需要简单地配置脚本即可。

三、架构

在这里插入图片描述
架构特点:
工作模式角度:基于客户端,仅需一台机器就能完成。
MR角度:Sqoop只需要提交一个Map任务,数据的传输和转换依靠Mapper,不需要Reduce;执行过程可以通过Yarn来监控。
安全角度:执行时需要显示指定用户名和密码;也可以通过配置文件来指定。安全性不高。

四、数据导入过程

在这里插入图片描述

五、数据导出过程

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值