HIVE与HDFS进行数据导入导出操作

本文介绍了如何将HDFS文件导入到HIVE中,包括创建内部表和外部表的步骤,强调了内部表与外部表的区别,以及LOAD DATA操作中的注意事项。此外,还讲解了从HIVE将数据导出到HDFS的过程,导出时可自定义字段间隔符并包含字段名。
摘要由CSDN通过智能技术生成

1. 将HDFS文件导入到HIVE中 

1.1 创建内部表

create table result(user_id int ,product_id int ,rating float) commend "save user information" 
row format delimited fields terminated by ',' ;  
load data inpath "/hadoop/input/result.csv"

上面是是先创建一个表,然后指定表的分隔符为,

注意的点:

1. 创建的表为内部表,如果要创建外部表,则需要写成create external table result ,内部表和外部表的区别就是,内部表在删除表的时候,文件也会跟着删掉,如果是外部表,那么在删除表的时候,文件还是存在的不会删掉。

2.  load data inpath 如果写成Load data local inpath 那么就是导入的本地文件

3. 主要在进行load hdfs文件到HIVE,会发现本身放在hdfs路径下的文件消失了,实际并没有消失只是被移动到了hive的hdfs在warehouse目录下去了

4.指定字段之间的分隔符 ,默认分隔符为"\001”,如果分隔符不对,那么读进去的数据就是NULL

1.2. 创建外部表的方式

create external tabl
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值