Hive的内部表和外部表以及两者的区别

本文详细介绍了Hive中的内部表和外部表。内部表是默认的建表方式,外部表则通过`external`关键字标识。两者在`location`属性上并无本质区别,都能指定存储路径。在删除表时,内部表会删除对应HDFS上的数据,而外部表只删除元数据,数据文件仍保留。总结来说,主要差异在于删除操作时对数据的影响。
摘要由CSDN通过智能技术生成

1、建表语句
1.1 内部表
平时创建的普通表为内部表

create table `test_internal` (
id string comment 'ID', 
name string comment '名字'
)
comment '测试内部表'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

外部表
带external关键字的为外部表

create external table `test_external` (
id string comment 'ID', 
name string comment '名字'
)
comment '测试外部表'
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ;

仅从建表语句上看,内部表和外部表的区别为是否带有external关键字。

2、location
网上很多博客写的外部表建表语句中都带有location关键字,我这里单独分开来写。

其实不管是内部表还是外部表都可以加location关键字指定hive表的存储路径,当然也可以不加,从这点看是没有区别的。
如果不加location那么不管是内部表还是外部表都会在默认的hive配置的hdfs路径下下新建一个和表名相同的文件夹。
如果加了location指定另外的文件夹,那么在查询时,该文件夹下对应的数据会加载到hive表里。
示例:

2.1 数据
data.txt

002,李四
003,王五
hadoop fs -mkdir -p /tmp/dkl/internal
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值