Hive内部表外部表区别及各自使用场景 【 附录:常规DDL样例】

本文介绍了Hive内部表和外部表的主要区别,包括元数据管理、数据删除行为以及数据加载操作。内部表的数据由Hive管理,删除时元数据和数据一同删除;而外部表数据由HDFS管理,仅删除元数据,数据保留。使用场景方面,外部表适用于日志等重要数据,便于共享和恢复;内部表适合统计分析的中间结果,便于数据管理。文章还提供了一些DDL语句示例。
摘要由CSDN通过智能技术生成

写在前面

ps:干货很多…
我们都知道,Hive基本上就是内部表和外部表两种类型,在面试的时候,常会问到这种题目:
1.hive内部表和外部表的区别
2.什么时候使用内部表,什么时候使用外部表

来自官网的定义:

Managed tables
A managed table is stored under the hive.metastore.warehouse.dir path property, by default in a folder path similar to /user/hive/warehouse/databasename.db/tablename/. The default location can be overridden by the location property during table creation. If a managed table or partition is dropped, the data and metadata associated with that table or partition are deleted. If the PURGE option is not specified, the data is moved to a trash folder for a defined duration.

Use managed tables when Hive should manage the lifecycle of the table, or when generating temporary tables.

External tables
An external table describes the metadata / schema on external files. External table files can be accessed and managed by processes outside of Hive. External tables can
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值