Hive元数据与数据
分类 | 说明 |
---|---|
内部表 | 由Hive管理,类似与RDBMS中的表(删除后均被删除) |
外部表 | 真实数据不被Hive管理。已经存在HDFS中的数据,与内部表元数据组织是相同的,但数据存放位置是任意的(删除后只删除元数据,不删除真实数据) |
内部表
create table student(id int, name string, age string) row format delimited fields terminated by "\t" stored as textfile;
查看表头:
describe employee_external;
查看表格式化数据:
desc formatted student;
上传表数据并查询表数据存储在HDFS的文件:
dfs -put /opt/module/data/student.txt /user/hive/warehouse/temp.db/student;
查询表存储数据(DATA):
select * from student;
查询表元数据(METADATA),元数据在mySQL中:
select * from tbls;
外部表
create extrnal table student2(id int, name string, age string) row format delimited fields terminated by '\t' stored as textfile location '/tmp/student';
最后,本篇文章是基于我所学所知进行的知识总结,如有误论,虚心接受指正。参考文献是《Hadoop数据仓库实战》,感兴趣的小伙伴可以对其进行深入阅读。(2024/03/26)