1
)理论
因为表是外部表,所以
Hive
并非认为其完全拥有这份数据。删除该表并不会删除掉这
份数据,不过描述表的元数据信息会被删除掉。
2
)管理表和外部表的使用场景
每天将收集到的网站日志定期流入
HDFS
文本文件。在外部表(原始日志表)的基础上
做大量的统计分析,用到的中间表、结果表使用内部表存储,数据通过
SELECT+INSERT
进入
内部表。
3
)案例实操
分别创建部门和员工外部表,并向表中导入数据。
(0)原始数据
dept:
emp:
(1)上传数据到
HDFS
(2)建表语句,创建外部表
创建部门表
create external table if not exists dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by '\t';
创建员工表
(3)查看创建的表
hive (default)>show tables;
(4)查看表格式化数据
(5)删除外部表
hive (default)> drop table dept;
外部表删除后,
hdfs
中的数据还在,但是
metadata
中
dept
的元数据已被删除
5.3
管理表与外部表的互相转换
(1)查询表的类型
hive (default)> desc formatted student2;
Table Type: MANAGED_TABLE
(2)修改内部表
student2
为外部表
alter table student2 set tblproperties('EXTERNAL'='TRUE');
(3)查询表的类型
hive (default)> desc formatted student2;
Table Type: EXTERNAL_TABLE
(4)修改外部表
student2
为内部表
alter table student2 set tblproperties('EXTERNAL'='FALSE');
(5)查询表的类型
hive (default)> desc formatted student2;
Table Type: MANAGED_TABLE
注意:
('EXTERNAL'='TRUE')
和
('EXTERNAL'='FALSE')
为固定写法,区分大小写!