尚硅谷Sqoop

目录

一、Sqoop 简介

二、Sqoop 架构

2.1 Sqoop1 架构  (1.4.6,1.4.7)

2.2 Sqoop2 架构  (1.99.6,1.99.7)

 三、Sqoop 安装

3.1 部署方式

 四、Sqoop 使用方式

五、Sqoop的公用参数

5.1 数据库连接参数

5.2 import参数 

5.3 export参数 

5.4 hive参数


一、Sqoop 简介

Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目。

 

基本思想

插拔式Connector架构, Connector是与特定数据源相关的组件, 主要负责(从特定数据源中)抽取和加载数据。

用户可选择Sqoop自带的Connector, 或者数据库提供的native Connector。

Sqoop: MapReduce方式并行导入导出,性能高; 类型自动转换(用户也可自定义类型转换); 自动传播元信息。

二、Sqoop 架构

2.1 Sqoop1 架构  (1.4.6,1.4.7)

客户端工具, 不需要启动任何服务,调起MapReuce作业(实际只有Map操作), 使用方便, 只有命令行交互方式。

缺陷:
(1) 仅支持JDBC的Connector
(2) 要求依赖软件必须安装在客户端上(包括Mysql/Hadoop/Oracle客户端, JDBC驱动,数据库厂商提供的Connector等)。
(3)安全性差: 需要用户提供明文密码


 

2.2 Sqoop2 架构  (1.99.6,1.99.7)

引入了Sqoop Server端, 形成服务端-客户端,Connector集成到Server端,轻量客户端,部署较麻烦.
(1) Sqoop Client:
用户交互的方式:命令行(CLI) 和浏览器两种方式
(2) Sqoop Server:

  • Connector:
    1> Partitioner 数据切片
    2> Extractor 数据抽取 Map操作
    3> Loader 读取Extractor输出的数据,Reduce操作

  • Metadata: Sqoop中的元信息,次啊用轻量级数据库Apache Derby, 也可以替换为Mysql

  • RESTful和HTTP Server: 客户端对接请求

几个概念

Connector: 访问某种数据源的组件,负责抽取或写入数据;Sqoop2内置多个数据源组件:

  • generic-jdbc-connector: 访问支持JDBC协议的数据库的Connector
  • hdfs-connector: 访问Hadoop HDFS的Connector
  • kafka-connector: 访问kafka的Connector
  • kit-connector: 使用Kite SDK实现,可访问HDFS/Hive/Hbase


 

 三、Sqoop 安装

3.1 部署方式

修改conf/sqoop-env-template.sh名称为 sqoop-env.sh

  • 添加数据库厂商Jdbc驱动包到lib:
    Oracle - ojdbc6.jar
    Mysql - mysql-connector-java-5.1.40-bin.jar

  • 修改环境变量

 四、Sqoop 使用方式

五、Sqoop的公用参数

5.1 数据库连接参数

 

5.2 import参数 

5.3 export参数 

 

5.4 hive参数

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 内容概要 《计算机试卷1》是一份综合性的计算机基础和应用测试卷,涵盖了计算机硬件、软件、操作系统、网络、多媒体技术等多个领域的知识点。试卷包括单选题和操作应用两大类,单选题部分测试学生对计算机基础知识的掌握,操作应用部分则评估学生对计算机应用软件的实际操作能力。 ### 适用人群 本试卷适用于: - 计算机专业或信息技术相关专业的学生,用于课程学习或考试复习。 - 准备计算机等级考试或职业资格认证的人士,作为实战演练材料。 - 对计算机操作有兴趣的自学者,用于提升个人计算机应用技能。 - 计算机基础教育工作者,作为教学资源或出题参考。 ### 使用场景及目标 1. **学习评估**:作为学校或教育机构对学生计算机基础知识和应用技能的评估工具。 2. **自学测试**:供个人自学者检验自己对计算机知识的掌握程度和操作熟练度。 3. **职业发展**:帮助职场人士通过实际操作练习,提升计算机应用能力,增强工作竞争力。 4. **教学资源**:教师可以用于课堂教学,作为教学内容的补充或学生的课后练习。 5. **竞赛准备**:适合准备计算机相关竞赛的学生,作为强化训练和技能检测的材料。 试卷的目标是通过系统性的题目设计,帮助学生全面复习和巩固计算机基础知识,同时通过实际操作题目,提高学生解决实际问题的能力。通过本试卷的学习与练习,学生将能够更加深入地理解计算机的工作原理,掌握常用软件的使用方法,为未来的学术或职业生涯打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值