Sqoop常用命令与参数

最新推荐文章于 2023-12-15 17:51:37 发布

迷茫君

最新推荐文章于 2023-12-15 17:51:37 发布

阅读量702

点赞数 1

分类专栏： Sqoop 文章标签： Sqoop常用命令 Sqoop常用参数 Sqoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41610418/article/details/81713319

版权

Sqoop 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

Sqoop常用命令

命令	描述
import	将数据导入到集群，HDFS，HIve，HBase
export	将集群的数据导出到传统数据库中
job	用来生成一个sqoop任务的，生成后，该任务不执行，等待使用命令执行
list-databases	显示所有数据库名字
list-tables	显示某个数据库下所有表的名字
codegen	获取数据库某张表数据生java 并且打包成jar
import-all-tables	将某一个数据库下的所有的表导入到集群
merge	将HDFS下不同目录下的数据合并在一起，然后存放到指定目录
metastore	记录sqoop job的元数据信息，如果不启动metastore实例，可以在sqoop-site.xml中配置相关路径
create-hive-table	创建Hive表
eval	查看SQL的运行结果
import-mainframe	从其他服务器上导入数据到HDFS

参数详解

公用参数：数据库连接

命令	描述
–connect	连接数据库的URL
–connection-manager	使用管理类
–driver	手动指定要使用的JDBC驱动程序类
–hadoop-mapred-home	覆盖$ HADOOP_MAPRED_HOME
–help	打印使用说明
–password-file	设置包含验证密码的文件的路径
-P	从控制台读取密码
–password	设置验证密码
–username	设置认证用户名
–verbose	工作时打印更多信息

公用参数：import

命令	描述
–fields-terminated-by	设定每个字段以什么样的符号结果，默认为逗号
–lines-terminated-by	每一行以什么样的字符结束，默认为\n
–append	将数据附加到HDFS中的现有数据集
–as-textfile	以纯文本格式导入数据（默认）
–columns	要从表导入的列
–delete-target-dir	删除导入目标目录（如果存在）
–table	要阅读的表格
–target-dir	HDFS目的地目录
–where	导入期间要使用的WHERE子句
-z,–compress	启用压缩
–compression-codec	使用Hadoop编解码器（默认gzip）
-m,–num-mappers	使用n个 map任务并行导入
-e,–query	导入结果statement。
–optionally-enclosed-by	给有双引号或者单引号的字段前后加上指定的字符
–enclosed-by	给字段的值前后加上指定的字符
–escaped-by	对字段中的双引号加转义符

公用参数：export

命令	描述
–input-fields-terminated-by	导出数据中字段分隔符
–input-lines-terminated-by	导出数据中行分隔符

公用参数：hive

命令	描述
–hive-import	将数据从传统数据库中导入到Hive表中
–hive-overwrite	覆盖已存在的数据
–create-hive-table	more是false，如果表已经存在，则会创建失败
–hive-table	hive中表的名字
–hive-partition-key	创建分区，后面直接跟的就是分区名，类型默认为string
–hive-partition-value	导入数据的时候，指定一下是哪个分区

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Sqoop常用命令与参数

Sqoop常用命令命令描述 import 将数据导入到集群，HDFS，HIve，HBase export 将集群的数据导出到传统数据库中 job 用来生成一个sqoop任务的，生成后，该任务不执行，等待使用命令执行 list-databases 显示所有数据库名字 list-tables 显示某个数据库下所有表的名字...
复制链接

扫一扫

专栏目录

迷茫君 CSDN认证博客专家 CSDN认证企业博客

码龄7年

36: 原创

10万+: 周排名

139万+: 总排名

21万+: 访问

: 等级

1529: 积分

41: 粉丝

142: 获赞

67: 评论

352: 收藏

私信

关注

热门文章

分类专栏

Windows 1篇
Hadoop 3篇
Hadoop集群搭建 2篇
问题与解决 10篇
Sqoop 3篇
Hive 4篇
Linux 3篇
HBase 1篇
Storm 2篇
Scala 4篇
Spark 3篇
集成整合 1篇
Java编程 3篇

最新评论

Entering emergency mode. Exit the shell to continue.
hongdounuoyan: 你是正确答案和思路，正解。
并发、并行、串行、同步、异步的区别？
Celeste Climber: 我还查了下，回答自ChatGpt3.5 除了多进程、多线程和协程之外，还有一些其他的并发实现方式，例如：事件驱动（Event-driven）：事件驱动编程是一种并发编程模式，它将应用程序分解成多个小的事件，然后通过异步IO等方式处理这些事件。事件驱动编程通常应用于网络编程、GUI编程等领域。数据流（Dataflow）：数据流编程是一种将程序分解成数据流图的并发编程模式。在数据流编程中，程序可以看作是一个由多个数据流节点组成的有向图，每个节点代表一个数据处理单元，节点之间通过数据连接进行通信。数据流编程常用于大数据处理和流式计算等领域。软件事务内存（Software Transactional Memory，STM）：STM是一种并发编程模式，它提供了类似于数据库事务的操作接口，允许程序员将一组操作看作是一个原子事务。在STM中，多个线程可以并发地访问共享数据，并使用STM提供的事务接口进行读写操作。 Actor模型：Actor模型是一种并发编程模型，它将并发计算看作是由多个独立的执行单元（称为Actor）组成的系统。每个Actor都有自己的状态和行为，并通过消息传递进行通信。Actor模型通常应用于分布式系统和并发编程中。
并发、并行、串行、同步、异步的区别？
Celeste Climber: 并发就是多线程或多进程在操作系统调度过程中看起来是同时发生的意思，但其实是在不同的时间片调度执行，只是时间片时间很短。有多个线程进程在调度队列中并发执行，所以肯定是多个了
并发、并行、串行、同步、异步的区别？
秋冬337: 请问并发是否一般需要多个线程或者进程才能完成？求解答
并发、并行、串行、同步、异步的区别？
Celeste Climber: 串行:宏观上的任务顺序执行并行:宏观上的任务同时执行并发:需要分时间片调度执行同步:不创建新线程，需等待执行异步:创建新线程自己执行，不需要等待

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。