HIVE学习笔记----数据导入

最新推荐文章于 2023-05-23 09:46:41 发布

Karida122

最新推荐文章于 2023-05-23 09:46:41 发布

阅读量319

点赞数

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39855111/article/details/81206396

版权

学习笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

这篇博客详细介绍了如何使用Hive的load语句和Sqoop工具进行数据导入，包括从本地或HDFS加载数据到Hive表，以及从Oracle数据库导入数据到HDFS和Hive。同时，还涵盖了使用 Sqoop 导出Hive数据到Oracle的步骤，涉及了各种选项如分区、覆盖、where条件和查询语句的使用。

摘要由CSDN通过智能技术生成

使用load语句

load data [local] inpath 'filepath' [overwrite] ------(写local是为了表示从操作系统导入，不写则表示从HDFS导入)

-----（写overwrite是表示是否覆盖原表）

into table tablename [partition (partcoll=vall,partcol2=val2 ...)] ----分区

使用sqoop实现数据导入

sqoop是apache下开源框架，专门做数据导入；

sqoop的安装需要下载tar包，并解压，设置两个环境变量，一个是HADOOP_COMMON_HOME,一个是HADOOP_MAPRED_HOME;

使用sqoop导入到oracle数据到HDFS中

./sqoop import --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp --columns 'empno,ename,job,sal,deptno' -m 1 --target-dir '/sqoop/emp'

----- -m 1 表明mapreduce的进程数是一个

----初次导入时可以会报驱动找不到，需要把对应数据库驱动上传到lib目录下

使用sqoop导入oracle数据到hive中

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno'

使用sqoop导入oracle数据到hive中，并指定表名

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno' --hive-table emp1

使用sqoop导入oracle数据到hive中，并使用where条件

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno' --hive-table emp1 --where 'deptno=10'

使用sqoop导入oracle数据到hive中，并使用查询语句

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp -m 1 --query 'select * from emp where sal<2000 and $CONDITIONS' --target-dir '/sqoop/emp5' --hive-table emp5

使用sqoop将hive中的数据导出到oracle中

./sqoop emport --connect jdbc:oracle:thin:@IP:port:orcl --username scott --password

tiger --table emp -m 1 --table MYEMP --export-dir ******* -------------******是指HDFS上要导出文件的目录，且oracle中提前建好跟文件字段类型一致的表结构

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。