hive内部表和外部表的区别

3 篇文章 0 订阅
1 篇文章 0 订阅

我们在使用数据仓库时,一般会公司会使用hive作为首选数据仓库而不是性能更高Teradata(数据仓库配备性能最高、最可靠的大规模并行处理 (MPP) 平台,能够高速处理海量数据,其性能远远高于Hive)呢,这就是hive的最大的优点一个是原生hadoop生态系统完全兼容第二个就是不要钱。关于数据仓库是什么我之前做过解释,这里就添加一个面试常问的问题,hive内部表和外部表有什么区别?

其核心就一个:默认创建的内部表是存储在hive数据仓库的指定目录下面的/user/hive/warehouse/test.db下面,而如果是外部表,那么默认直接落地在HDFS下的/user目录下
衍生出来的结果就是,内部表在删除时会删除元数据和表数据,而外部表不在hive目录下,只删除元数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值