在学习Hive的配置管理参数时,曾将参数分为四类:Hive管理参数、Hive元存储(Metastore)管理参数、与Hadoop交互的管理参数、用于传递运行时信息的参数,当时并没有对Metastore参数进行深入的学习,现在就开始学习这部分的内容。
Hive中表和分区的所有元数据都存储在Hive的元存储(Metastore)中。元数据使用JPOX(Java Persistent Objects)对象关系映射解决方案进行持久化,所以任何被JPOX支持的存储都可以被Hive使用。大多数商业关系型数据库和许多开源的数据存储都被支持,所以就可以被Hive使用存储元数据。Hive支持三种不同的元存储服务器,分别为:内嵌式元存储、本地元存储、远程元存储,每种存储方式使用不同的配置参数,相关的配置参数如下表所示:
| 配置参数 |
描述 |
| javax.jdo.option.ConnectionURL |
包含元数据的数据存储的JDBC连接字符 |
Hive元存储配置详解:内嵌、本地与远程模式

本文深入探讨了Hive的Metastore管理,包括内嵌式、本地和远程元存储的配置。Hive的表和分区元数据存储在Metastore中,使用JPOX进行持久化,支持多种数据库。内嵌式元存储适用于单元测试,本地元存储每个客户端直接连接数据库,远程元存储通过Thrift服务器进行通信。
订阅专栏 解锁全文
7690

被折叠的 条评论
为什么被折叠?



