HIVE与HDFS进行数据导入导出操作

最新推荐文章于 2024-09-10 01:03:00 发布

幸运的Alina

最新推荐文章于 2024-09-10 01:03:00 发布

阅读量5.6k

点赞数 1

分类专栏： HIve 文章标签： HDFS HIVE

本文链接：https://blog.csdn.net/qq_27575895/article/details/97138344

版权

本文介绍了如何将HDFS文件导入到HIVE中，包括创建内部表和外部表的步骤，强调了内部表与外部表的区别，以及LOAD DATA操作中的注意事项。此外，还讲解了从HIVE将数据导出到HDFS的过程，导出时可自定义字段间隔符并包含字段名。

摘要由CSDN通过智能技术生成

1. 将HDFS文件导入到HIVE中

1.1 创建内部表

create table result(user_id int ,product_id int ,rating float) commend "save user information" 
row format delimited fields terminated by ',' ;  
load data inpath "/hadoop/input/result.csv"

上面是是先创建一个表，然后指定表的分隔符为，

注意的点：

1. 创建的表为内部表，如果要创建外部表，则需要写成create external table result ，内部表和外部表的区别就是，内部表在删除表的时候，文件也会跟着删掉，如果是外部表，那么在删除表的时候，文件还是存在的不会删掉。

2. load data inpath 如果写成Load data local inpath 那么就是导入的本地文件

3. 主要在进行load hdfs文件到HIVE，会发现本身放在hdfs路径下的文件消失了，实际并没有消失只是被移动到了hive的hdfs在warehouse目录下去了

4.指定字段之间的分隔符，默认分隔符为"\001”，如果分隔符不对，那么读进去的数据就是NULL

1.2. 创建外部表的方式

create external tabl

最低0.47元/天解锁文章

幸运的Alina

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录