Hive 中的数据组织管理方式
Database和 Table
这两个概念其实很常见,Database 又叫命名空间,其实主要是为了组织管理和命名冲突,例如表名冲突,视图冲突,组织管理含义就很多了
这里我们有两个Database其实可以看到Database 在hive(HDFS) 上的物理存储就是两个文件夹,只不过这两个文件夹都有了自己的后缀 .db,如果你去命令行里查看的话是没有这个后缀的
我们随便选一个文件夹进行,发现表的物理存储或者是组织管理方式也是文件夹,其实到这里我们就差不多理解了,Database和 Table 都是数据组织的方式,而且都是文件夹,后面当你学习到分区的时候,你还会看到分区也是这样的
注意这里的文件夹名字就是表名字,没有了后缀