1、Hive内部表和外部表建表方式,hive默认为内部表:
#内部表
CREATE TABLE `test.table1`(
`id` bigint comment '小区id',
`name` string comment '小区名称',
`c_id` bigint comment '城市id')
comment '小区表'
PARTITIONED BY (dt string comment '日期分区')
row format delimited fields terminated by ','
stored as textfile;
#外部表
CREATE EXTERNAL TABLE `test.table2`(
`id` bigint comment '小区id',
`name` string comment '小区名称',
`c_id` bigint comment '城市id')
comment '小区表'
PARTITIONED BY (dt string comment '日期分区')
row format delimited fields terminated by ','
stored as textfile;
2、Hive内部表和外部表查看及转换:
查看表的描述信息
desc extended table1; # 查看表的扩展信息
desc formatted table2; # 格式化表的扩展信息
内部表转外部表
ALTER TABLE table1 SET TBLPROPERTIES ('EXTERNAL'='TRUE');
外部表转内部表
ALTER TABLE table1 SET TBLPROPERTIES ('EXTERNAL'='FALSE');
3、Hive内部表和外部表区别:
主要分为三方面,load、drop 和使用场景。
load导入数据:
创建内部表时,会将数据移动到hive指向的路径,并且由hive来管理数据的生命周期。
创建外部表时,只是记录数据所在的路径,不对数据位置做改变。
drop删除表:
删除一个内部表或分区,则会删除与该表或分区关联的数据和元数据。
删除一个外部表,只是删除元数据,数据不会删除。
使用场景:
当 Hive 应该管理表的生命周期,或者在生成临时表时,使用内部表。
一般源数据使用外部表。