Sqoop简介

Sqoop是一个用于在Hadoop和RDBMS之间高效传输数据的工具。它将用户指令转换为MapReduce任务,通过YARN进行分布式执行。文章介绍了Sqoop1和Sqoop2的主要区别,Sqoop1以其简单、灵活、易用性著称,而Sqoop2增加了元数据记录和通用性,但配置相对复杂。
摘要由CSDN通过智能技术生成

目的:

  •  在Hadoop和RDBMS之间高效传输数据:
  1. hadoop大数据存储平台:hdfs、hive、hbase
  2. rdbms关系型数据库 : mysql、oracle、postgresql、mssql

原理:

  • 把用户的指令解析编译成MR任务,发布到yarn上分布式执行
  • MR任务把输入和输出分别对接RDBMS和Hadoop就能完成数据的转移

版本:

  • sqoop1:
  1. 核心组件:TaskTranslator,解析编译用户指令,生成mr任务发布到yarn
  2. cli、api :和用户交互,从用户接受命令,把命令发送给TaskTranslator
  3. 优点:简单、灵活、易用,不需要做什么配置,指令即配置,指令可以马上执行
  4. 缺点:支持shell和java等语言,对于其他语言无法支持
  • sqoop2
  1. server端:
    1. 核心组件:TaskTranslator,解析编译用户指令,生成mr任务发布到yarn
    2. Connector连接存储系统的中间组件
    3. Metadata:
      1. 存储用户跟存储系统的
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值