sqoop

5人阅读 评论(0) 收藏 举报
分类:
	====================================================================	
	sqoop 沟通hdfs和关系型数据库的桥梁,可以从hdfs导出数据到关系型数据库,也可以从关系型数据库导入数据到hdfs
		下载:
			Apache 提供的工具
		安装:
			要求必须有jdk 和 hadoop的支持,并且有版本要求。
			上传到linux中,进行解压
			sqoop可以通过JAVA_HOME找到jdk 可以通过HADOOP_HOME找到hadoop所以不需要做任何配置就可以工作。
			需要将要连接的数据库的驱动包加入sqoop的lib目录下                               

		从关系型数据库导入数据到hdfs:
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123  --table trade_detail --columns 'id, account, income, expenses'
			
			指定输出路径、指定数据分隔符
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123  --table trade_detail --target-dir '/sqoop/td' --fields-terminated-by '\t'
			
			指定Map数量 -m 
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123  --table trade_detail --target-dir '/sqoop/td1' --fields-terminated-by '\t' -m 2

			增加where条件, 注意:条件必须用引号引起来
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123  --table trade_detail --where 'id>3' --target-dir '/sqoop/td2' 

			增加query语句(使用 \ 将语句换行)
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123 --query 'SELECT * FROM trade_detail where id > 2 AND $CONDITIONS' --split-by trade_detail.id --target-dir '/sqoop/td3'

			注意:如果使用--query这个命令的时候,需要注意的是where后面的参数,AND $CONDITIONS这个参数必须加上
			而且存在单引号与双引号的区别,如果--query后面使用的是双引号,那么需要在$CONDITIONS前加上\即\$CONDITIONS
			如果设置map数量为1个时即-m 1,不用加上--split-by ${tablename.column},否则需要加上
			
		从hdfs导出数据到关系型数据库:
			sqoop export --connect jdbc:mysql://192.168.3.51:3306/tedu --username root --password 123 --export-dir '/td3' --table td_bak -m 1 --fields-terminated-by ','

		从关系型数据库导入数据到hive:
			sqoop import --connect jdbc:mysql://192.168.1.10:3306/tedu --username root --password 123  --table trade_detail --hive-import-hive-table hivetab1 -m 1

		从hive导出数据到关系型数据库+-
			就是将hive在hdfs文件夹下的文件导出到mysql中,参考从hdfs到处数据到关系型数据库的过程。
	====================================================================
sqoop:yeng
查看评论

让ListBox控件支持拖动

通常我们通过ListBox控件来显示我们的信息列表,然后我们可以通过鼠标来选择我们的条目信息,但VC中的ListBox控件是不支持拖动的。也许我们有时需要改变我们的列表顺序,已适应我们的要求,下面是实...
  • heyongzhou
  • heyongzhou
  • 2001-08-03 10:46:00
  • 896

Sqoop集群搭建.

  • 2017年09月21日 11:29
  • 26KB
  • 下载

sqoop使用与原理

1、sqoop简介     sqoop是一个用来将hadoop中hdfs和关系型数据库中的数据相互迁移的工具,可以将一个关系型数据库(mysql、oracle等)中的数据     导入...
  • u013234372
  • u013234372
  • 2014-10-07 15:48:43
  • 3952

sqoop并行导入数据

使用sqoop工具进行数据导入导出中可以进行并行导入的方法 例如  从mysql数据库中导入到hive中可以执行 sqoop import --connect jdbc:mysql://local...
  • jiedushi
  • jiedushi
  • 2012-03-09 13:02:58
  • 9468

Sqoop源码浅析

前言Apache Sqoop应该是在hadoop与SQL间上最常用的数据导入导出工具了。最近应为面试,简单看了一下sqoop 1.4.6的源码,整理如下。驱动类——Sqooporg.apache.sq...
  • hammertank
  • hammertank
  • 2016-07-10 20:37:26
  • 2603

Sqoop操作实践

Sqoop操作实践@(Hadoop)Sqoop常用参命令 序号 命令/command 类 说明 1 impor ImportTool 从关系型数据库中导入数据(来自表或者...
  • qq1010885678
  • qq1010885678
  • 2016-01-12 16:12:58
  • 4335

sqoop定时增量导入

sqoop使用hsql来存储job信息,开启metastor service将job信息共享,所有node上的sqoop都可以运行同一个job 一、sqoop的配置文件在sqoop.site.xml中...
  • ryantotti
  • ryantotti
  • 2013-11-06 14:23:42
  • 28143

mysql hive sqoop 分区,优化

sqoop 报错  for input string \N   是因为 hive 用\N 存 NULL, 这样就需要 设置input-null-string '\\\\N' input-null-no...
  • zjw11763
  • zjw11763
  • 2013-05-13 19:12:04
  • 2366

Sqoop架构以及应用介绍

本篇文章在具体介绍Sqoop之前,先给大家用一个流程图介绍Hadoop业务的开发流程以及Sqoop在业务当中的实际地位。 如上图所示:在实际的业务当中,我们首先对原始数据集通过MapRed...
  • a2011480169
  • a2011480169
  • 2016-05-25 21:18:45
  • 15078

Sqoop学习笔记

一、Sqoop简介Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop...
  • scgaliguodong123_
  • scgaliguodong123_
  • 2015-04-08 11:32:53
  • 1117
    个人资料
    持之以恒
    等级:
    访问量: 2710
    积分: 868
    排名: 6万+