Managed Table(内部表/管理表)
管理表有如下特点:
- 表数据存储在管理表的存储目录下;
- 删除管理表时,元数据和表数据都会被删除;
External Table(外部表)
外部表特点如下:
- 表数据为已经在HDFS中存在的数据,外部表的目录并没有数据(相当于一个链接);
- 删除外部表时,只会删除元数据,并不会删除表数据;
使用场景:共享数据场景(同一份数据可能被多个工具分析使用);
Partitioned Table(分区表)
作用:用于提高查询速度;
原理:将数据按照分区条件分组存储,如下图所示:
参考: