sqoop 原理与部署

sqoop原理

  • sqoop介绍

    Sqoop是Apache旗下的一款“hadoop和关系型数据库服务器之间传送数据”的工具。
      导入数据:MySQL、Oracle导入数据到hadoop的hdfs、hive、hbase等数据存储系统。
      导出数据:从hadoop的文件系统中导出数据到关系型数据库中。

  • sqoop架构

file

  • 导入流程
    1. 首先通过jdbc读取关系型数据库元数据信息,获取到表结构。
    2. 根据元数据信息生成Java类。
    3. 启动import程序,通过jdbc读取关系型数据库数据,并通过上一步的Java类进行序列化。
    4. MapReduce并行写数据到Hadoop中,并使用Java类进行反序列化。
  • 导出流程
    1. sqoop通过jdbc读取关系型数据库元数据,获取到表结构信息,生成Java类,用于序列化。
    2. MapReduce并行读取hdfs数据,并且通过Java类进行序列化。
    3. export程序启动,通过Java类反序列化,同时启动多个map,通过jdbc将数据写入到关系型数据库中。

cdh部署sqoop

  • 添加服务

file

file

  • 添加gateway节点

file

  • 完成效果

file

file

海汼部落原创文章,原文链接:http://www.hainiubl.com/topics/75726

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值