Sqoop
黑猴子的家
拥有技术,便拥有自由
B站 Up主专注于技术 https://space.bilibili.com/398602910
展开
-
黑猴子的家:Sqoop 命令&参数:create-hive-table
** 生成与关系数据库表结构对应的hive表结构。**1、命令案列[victor@node1 sqoop-1.4.7]$ bin/sqoop create-hive-table \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--table staff \--hive...原创 2018-09-09 08:38:00 · 4183 阅读 · 0 评论 -
黑猴子的家:Sqoop list-tables
1、案列[victor@node1 sqoop-1.4.7]$ bin/sqoop list-tables \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000参数和公用参数一样原创 2018-09-09 08:58:00 · 1075 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:merge
将HDFS中不同目录下面的数据合并在一起并放入指定目录中1、数据new_staff1 AAA male2 BBB male3 CCC male4 DDD maleold_staff1 AAA female2 CCC female3 ...原创 2018-09-09 09:02:00 · 251 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:metastore
记录了Sqoop job的元数据信息,如果不启动该服务,那么默认job元数据的存储目录为~/.sqoop,可在sqoop-site.xml中修改。1、命令启动sqoop的metastore服务[victor@node1 sqoop-1.4.7]$ bin/sqoop metastore关闭sqoop的metastore服务[victor@node1 sqoop-1.4.7...原创 2018-09-09 09:04:00 · 358 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令与参数详解
1、Sqoop 公用参数:数据库连接https://www.jianshu.com/p/51498d5a648d2、Sqoop 公用参数:importhttps://www.jianshu.com/p/88a9e915b5f83、Sqoop 公用参数:exporthttps://www.jianshu.com/p/882722c7c0174、Sqoop 公用参数:hive...原创 2018-09-09 09:16:00 · 319 阅读 · 0 评论 -
黑猴子的家:Sqoop 手册
1、Sqoop简介https://www.jianshu.com/p/58f133a0c83f2、Sqoop原理https://www.jianshu.com/p/2e528bdef4403、Sqoop架构https://www.jianshu.com/p/4f47f467eb664、Sqoop应用场景https://www.jianshu.com/p/c0bf67a9...原创 2018-09-09 09:17:00 · 204 阅读 · 0 评论 -
黑猴子的家:Hue 与 Sqoop2 集成
HUE只支持Sqoop2的集成,不支持Sqoop1集成,在此不再演示。http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/user-guide/sqoop.html原创 2018-09-14 14:52:00 · 643 阅读 · 0 评论 -
黑猴子的家:Sqoop API
Sqoop API -> GitHubhttps://github.com/liufengji/Sqoop_API.git原创 2018-09-30 14:32:00 · 307 阅读 · 0 评论 -
黑猴子的家:Sqoop简介 (sql to hadoop)
官网http://sqoop.apache.org/Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。2018年8月22日查看,最新的稳定版本是1.4.7,发布时间是2018年2月22日。Sqoop2的最新版本是1.99.7。请注意,...原创 2018-09-07 22:35:00 · 262 阅读 · 0 评论 -
黑猴子的家:Sqoop原理 (sql to hadoop)
sqoop 可以实现把mysql 数据导入到 Hbase 、Hive、HDFS也可以实现把HDFS、HBase、Hive的数据导入到Mysql中将导入或导出命令翻译成mapreduce程序来实现。翻译出的mapreduce中,主要是对 inputformat 和 outputformat 进行定制。...原创 2018-09-07 22:37:00 · 188 阅读 · 0 评论 -
黑猴子的家:Sqoop架构
Sqoop架构非常简单,其整合了HDFS、Hive、HBase、Oozie、Mysql,通过MapReduce任务来传输数据,从而实现并发特性和容错机制原创 2018-09-07 22:41:00 · 138 阅读 · 0 评论 -
黑猴子的家:Sqoop应用场景
将业务数据导入分析平台,将分析结果同步到关系数据库image.png原创 2018-09-07 22:43:00 · 666 阅读 · 0 评论 -
黑猴子的家:Sqoop 安装
安装Sqoop的前提是已经具备Java和Hadoop的环境,为后续的测试,最好也安装好Hive、HBase、Zookeeper、Mysql1、下载地址http://mirrors.hust.edu.cn/apache/sqoop2、上传安装包sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz到虚拟机中3、解压sqoop安装包到指定目录[victor@...原创 2018-09-07 22:51:00 · 187 阅读 · 0 评论 -
黑猴子的家:Sqoop数据导入工具import
import工具用来将HDFS平台外部的结构化存储系统中的数据导入到Hadoop平台,以便后续分析。使用import工具需要指定split-by参数。Sqoop会根据该参数值对关系型数据库的表数据进行切分,然后将切分后的数据分配到不同的map任务中。每个map负责导入对应区域内的数据。选项 含义说明 --append 将数据追加到HDFS上一个已存在的数据集上 --as-a...原创 2018-09-09 06:50:00 · 140 阅读 · 0 评论 -
黑猴子的家:Sqoop数据导出工具export
选项 含义说明 --validate <class-name> 启用数据副本验证功能,仅支持单表拷贝,可以指定验证使用的实现类 --validation-threshold <class-name> 指定验证门限所使用的类 --direct 使用直接导出模式(优化速度) --export-dir <dir> 导出的H...原创 2018-09-09 06:54:00 · 151 阅读 · 0 评论 -
黑猴子的家:Sqoop RDBMS到HDFS
1、确定Mysql服务开启正常[victor@node1 ~]$ service mysql statusRedirecting to /bin/systemctl status mysql.service● mysqld.service - MySQL Community Server Loaded: loaded (/usr/lib/systemd/system/mysqld...原创 2018-09-09 07:00:00 · 146 阅读 · 0 评论 -
黑猴子的家:Sqoop list-databases
1、案列[victor@node1 sqoop-1.4.7]$ bin/sqoop list-databases \--connect jdbc:mysql://node1:3306/ \--username root \--password 000000参数和公用参数一样原创 2018-09-09 08:57:00 · 1828 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:job
用来生成一个sqoop任务,生成后不会立即执行,需要手动执行。1、命令案列[victor@node1 sqoop-1.4.7]$ bin/sqoop job \ --create myjob \-- import-all-tables \ --connect jdbc:mysql://node1:3306/company \ --username root \ --passw...原创 2018-09-09 08:47:00 · 477 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:import-all-tables
可以将RDBMS中的所有表导入到HDFS中,每一个表都对应一个HDFS目录1、命令案列[victor@node1 sqoop-1.4.7]$ bin/sqoop import-all-tables \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--warehouse-...原创 2018-09-09 08:43:00 · 514 阅读 · 0 评论 -
黑猴子的家:Sqoop RDBMS到Hive
1、mysql 导入hive[victor@node1 sqoop-1.4.7]$ bin/sqoop import \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--table staff \--num-mappers 1 \--hive-import \--fi...原创 2018-09-09 07:14:00 · 831 阅读 · 0 评论 -
黑猴子的家:Sqoop HIVE/HDFS到RDBMS
[victor@node1 sqoop-1.4.7]$ bin/sqoop export \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--table staff \--num-mappers 1 \--export-dir /user/hive/warehouse/st...原创 2018-09-09 07:26:00 · 200 阅读 · 0 评论 -
黑猴子的家:Sqoop 公用参数:hive
序号 参数 说明 1 --hive-delims-replacement <arg> 用自定义的字符串替换掉数据中的\r\n和\013 \010等字符 2 --hive-drop-import-delims 在导入数据到hive时,去掉数据中的\r\n\013\010这样的字符 3 --map-column-hive <arg...原创 2018-09-09 07:46:00 · 297 阅读 · 0 评论 -
黑猴子的家:HBase 与 Sqoop 集成
Sqoop supports additional import targets beyond HDFS and Hive. Sqoop can also import records into a table in HBase.之前我们已经学习过如何使用Sqoop在Hadoop集群和关系型数据库中进行数据的导入导出工作,接下来我们学习一下利用Sqoop在HBase和RDBMS中进行数据的转储。...原创 2018-10-05 09:24:00 · 144 阅读 · 0 评论 -
黑猴子的家:Sqoop RDBMS 到 HBase
1、相关参数参数 描述 --column-family <family> Sets the target column family for the import 设置导入的目标列族。 --hbase-create-table If specified, create missing HBase tables是否自动创建不存在的HBase表(这就意味着,不...原创 2018-09-09 07:22:00 · 153 阅读 · 0 评论 -
黑猴子的家:Sqoop HBase 到 RDBMS
mysql导入hbase可以直接通过sqoop进行,但是hbase导出到mysql无法直接进行,需要经过hive的中间作用来完成,思路是这样的hbase→hive外部表→hive内部表→sqoop导出→mysql,这就需要hive和hbase 的整合集成1、Hive和HBase整合集成https://www.jianshu.com/p/e9d1ccfc6ff12、Hive与HBase集...原创 2018-09-09 07:33:00 · 295 阅读 · 0 评论 -
黑猴子的家:Sqoop 导入数据
在Sqoop中,“导入”概念指:从非大数据集群(RDBMS)向大数据集群(HDFS,HIVE,HBASE)中传输数据,叫做:导入,即使用import关键字。1、Sqoop RDBMS到HDFShttps://www.jianshu.com/p/d1c6b3bee5bf2、Sqoop RDBMS到Hivehttps://www.jianshu.com/p/5da32929c7333、Sq...原创 2018-09-09 07:24:00 · 116 阅读 · 0 评论 -
黑猴子的家:Sqoop 脚本打包
使用opt格式的文件打包sqoop命令,然后执行1、创建一个.opt文件[victor@node1 sqoop-1.4.7]$ mkdir opt[victor@node1 sqoop-1.4.7]$ touch opt/job_HDFS2RDBMS.opt2、编写sqoop脚本[victor@node1 sqoop-1.4.7]$ vim opt/job_HDFS2RDB...原创 2018-09-09 07:37:00 · 239 阅读 · 0 评论 -
黑猴子的家:Sqoop 常用命令列举
这里给大家列出来了一部分Sqoop操作时的常用参数,以供参考。序号 命令 类 说明 1 import ImportTool 将数据导入到集群 2 export ExportTool 将集群数据导出 3 codegen CodeGenTool 获取数据库中某张表数据生成Java并打包Jar 4 crea...原创 2018-09-09 07:40:00 · 178 阅读 · 0 评论 -
黑猴子的家:Sqoop 公用参数:数据库连接
序号 参数 说明 1 --connect 连接关系型数据库的URL 2 --connection-manager 指定要使用的连接管理类 3 --driver Hadoop根目录 4 --help 打印帮助信息 5 --password 连接数据库的密码 6 --username 连接数据库...原创 2018-09-09 07:42:00 · 170 阅读 · 0 评论 -
黑猴子的家:Sqoop 公用参数:import
序号 参数 说明 1 --enclosed-by <char> 给字段值前加上指定的字符 2 --escaped-by <char> 对字段中的双引号加转义符 3 --fields-terminated-by <char> 设定每个字段是以什么符号作为结束,默认为逗号 4 --lines-te...原创 2018-09-09 07:44:00 · 121 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:import
将关系型数据库中的数据导入到HDFS(包括Hive,HBase)中,如果导入的是Hive,那么当Hive中没有对应表时,则自动创建。序号 参数 说明 1 --append 将数据追加到HDFS中已经存在的DataSet中,如果使用该参数,sqoop会把数据先导入到临时文件目录,再合并。 2 --as-avrodatafile 将数据导入到一个Avro...原创 2018-09-09 07:50:00 · 289 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:export
从HDFS(包括Hive和HBase)中将数据导出到关系型数据库中。1、命令案列[victor@node1 sqoop-1.4.7]$ bin/sqoop export \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--table staff \--export-d...原创 2018-09-09 08:03:00 · 205 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:codegen
1、将关系型数据库中的表映射为一个Java类,在该类中有各列对应的各个字段。[victor@node1 sqoop-1.4.7]$ bin/sqoop codegen \--connect jdbc:mysql://node1:3306/company \--username root \--password 000000 \--table staff \--bindir /opt...原创 2018-09-09 08:35:00 · 713 阅读 · 0 评论 -
黑猴子的家:Sqoop 命令&参数:eval
可以快速的使用SQL语句对关系型数据库进行操作,经常用于在import数据之前,了解一下SQL语句是否正确,数据是否正常,并可以将结果显示在控制台。1、案列[victor@node1 sqoop-1.4.7]$ bin/sqoop eval \--connect jdbc:mysql://node1:3306/company \--username root \--password...原创 2018-09-09 08:40:00 · 532 阅读 · 0 评论 -
黑猴子的家:Sqoop 公用参数:export
序号 参数 说明 1 --input-enclosed-by <char> 对字段值前后加上指定字符 2 --input-escaped-by <char> 对含有转移符的字段做转义处理 3 --input-fields-terminated-by <char> 字段之间的分隔符 4 --in...原创 2018-09-09 07:45:00 · 222 阅读 · 0 评论