hive的内部表和外部表

Hive有两种类型的表:

Managed Table 内部表
External Table 外部表
下面我们详细介绍这两种表.

Managed Table

这种表也被称作Internal Table.这是Hive中的默认的类型.如果你在创建表的时候没有指明Managed或者External,那么默认就会给你创建Managed Table.

Managed Table的数据,会存放在HDFS中的特定的位置中,通常是/user/hduser/hive/warehouse..

External Table

External Table特别适用于想要在Hive之外使用表的数据的情况.当你删除External Table时,只是删除了表的元数据,它的数据并没有被删除.

什么时候使用哪种表?

Managed Table

数据是临时数据
外部的程序无法访问这些数据
数据会随着表的删除而删除

External Table

数据可以被外部程序访问
你不能基于已经存在的表再创建表
表被删除时,数据不会被删除

3 内部表和外部表的区别

内部表和外部表的区别

内部表对数据拥有所有权,将内部表数据保存在hive.metastore.warehouse.dir目录下,删除内部表时,相应的数据也会被删除
Hive 对外部表的数据仅仅拥有使用权;外部表只有一个过程,加载数据和创建表同时完成(CREATE EXTERNAL TABLE…LOCATION),实际数据是存储在LOCATION后面指定的 HDFS 路径中,并不会移动到数据仓库目录中

4、使用场景是什么?

外部表使用场景:导入hdfs中的源数据
内部表使用场景:存放Hive处理的中间表、结果表

如:
每天将日志数据传入HDFS,一天一个目录;Hive基于流入的数据建立外部表,将每天HDFS上的原始日志映射到外部表的天分区中;
在外部表基础上做统计分析,使用内部表存储中间表、结果表,数据通过SELECT+INSERT进入内部表

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值