1.Metastore作用
客户端连接metastore服务,metastore再去连接MySQL数据库来存取元数据。有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL数据库的用户名和密码,只需要连接metastore 服务即可。
两种连接Hive客户端方式的流程如下:
bin/hin --访问--> metaStore server --访问-->MySQL
beeline --访问-->hiveServer2 --访问--> metaStore server --访问--> MySQL
2.Metastore有3中开启方式
- 默认开启方式:
没有配置metaStore的时候,每当开启bin/hive;或者开启hiveServer2的时候,都会在内部启动一个metastore。嵌入式服务;资源比较浪费,如果开启多个窗口,就会存在多个metastore server。 - local mataStore(本地)
当metaStore和装载元数据的数据库(MySQL)存在同一机器上时配置是此模式,
开启metastore服务就只需要开启一次就好。 - Remote Metastore(远程)
当metaStore和装载元数据的数据库(MySQL)不存在同一机器上时配置是此模式,
开启metastore服务就只需要开启一次就好。
3.HiveServer2作用
HiveServer2支持一个新的命令行Shell,称为Beeline,是基于SQLLine CLI的JDBC客户端。其作用是:
- 为hive提供了一种允许客户端远程访问的服务。
- 基于 thrift 协议,支持跨平台,跨编程语言对hive访问;
Beeline 和 jdbc-hive 底层都是通过HiveServer2连接的MetaStore,metastore再去连接MySQL数据库来存取元数据。所以,使用JDBC编码连接Hive时需要提前启动HiveServer2服务。