Hive的功能:将SQL语句MapReduce程序运行
分布式SQL计算能力的基本架构(两个核心组件):
- 元数据管理,帮助记录各类元数据
- SQL解析器,完成SQL到MapReduce的转换
Hive的核心架构:元数据管理(存储)、SQL解析器、用户接口
Hive的部署:hive本体(单机服务)和元数据服务所需的关系型数据库(以MySQL为例),两个均部署在hadoop102上。
启动Hive命令
1、启动元数据管理服务(必须启动,否则无法工作)
- 前台启动:bin/hive --service metastore
- 后台启动:nohup bin/hive --service metastore >> logs/metastore.log 2>&1 &
2、启动客户端,二选一(当前先选择Hive Shell方式)
- Hive Shell方式(可以直接写SQL):bin/hive
- Hive ThriftServer方式(不可直接写SQL,需要外部客户端链接使用):bin/hive --service hiveserver2
3、HiveServer2服务
在hive安装的服务器上,首先启动metastore服务,然后启动hiveserver2服务。
nohup bin/hive --service metastore >> logs/metastore.log 2>&1 &
nohup bin/hive --service hiveserver2 >> logs/hiveserver2.log 2>&1 &
4、beeline客户端
在node1上使用beeline客户端进行连接访问。需要注意hiveserver2服务启动之后需要稍等一会才可以对外提供服务。 Beeline是JDBC的客户端,通过JDBC协议和Hiveserver2服务进行通信,协议的地址是:jdbc:hive2://hadoop102:10000
5、Hive第三方客户端
DataGrip、Dbeaver、SQuirrel SQL Client等