HIVE学习笔记----数据导入

这篇博客详细介绍了如何使用Hive的load语句和Sqoop工具进行数据导入,包括从本地或HDFS加载数据到Hive表,以及从Oracle数据库导入数据到HDFS和Hive。同时,还涵盖了使用 Sqoop 导出Hive数据到Oracle的步骤,涉及了各种选项如分区、覆盖、where条件和查询语句的使用。
摘要由CSDN通过智能技术生成
  • 使用load语句

     load data [local] inpath 'filepath' [overwrite]       ------(写local是为了表示从操作系统导入,不写则表示从HDFS导入)

                                                                                -----(写overwrite是表示是否覆盖原表)

     into table tablename [partition (partcoll=vall,partcol2=val2 ...)]    ----分区

  •    使用sqoop实现数据导入

     sqoop是apache下开源框架,专门做数据导入      ;

  sqoop的安装需要下载tar包,并解压,设置两个环境变量,一个是HADOOP_COMMON_HOME,一个是HADOOP_MAPRED_HOME;

  • 使用sqoop导入到oracle数据到HDFS中

./sqoop import --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp --columns 'empno,ename,job,sal,deptno' -m 1 --target-dir  '/sqoop/emp'

-----   -m 1 表明mapreduce的进程数是一个

----初次导入时可以会报驱动找不到,需要把对应数据库驱动上传到lib目录下

  • 使用sqoop导入oracle数据到hive中

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno'

  • 使用sqoop导入oracle数据到hive中,并指定表名

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno' --hive-table emp1

  • 使用sqoop导入oracle数据到hive中,并使用where条件

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp -m 1 --columns 'empno,ename,job,sal,deptno' --hive-table emp1 --where 'deptno=10'

  • 使用sqoop导入oracle数据到hive中,并使用查询语句

./sqoop import --hive-import --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp -m 1 --query 'select * from emp where sal<2000 and $CONDITIONS' --target-dir '/sqoop/emp5' --hive-table emp5

  • 使用sqoop将hive中的数据导出到oracle中

./sqoop emport --connect jdbc:oracle:thin:@IP:port:orcl --username scott  --password

tiger --table emp -m 1 --table MYEMP --export-dir *******                    -------------******是指HDFS上要导出文件的目录,且oracle中提前建好跟文件字段类型一致的表结构

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值