1.hive简介
什么是分布式SQL?
通过分布式的方式, 执行SQL语句, 获取分析结果
学习hive的意义
1. 通过Java 或者 Python直接操作MapReduce, 也可以做分析, 但是开发难度稍大
2.通过SQL做分析, 相对简单易上手
3.Hive就是让我们写类SQL语法, 然后Hive底层会将其解析成MR任务来执行
2.HIVE架构图示(手动@夯哥)
3.HIVE初体验
启动Hive服务
1.首先启动Hadoop集群
[root@node1 ~]# start-all.sh
2.然后启动历史服务
[root@node1 ~]# mr-jobhistory-daemon.sh start historyserver
3.分别在node1, node2, node3三台机器中, 执行jps命令, 查看启动的Hadoop集群节点.
[root@node1 ~]# jps4.启动hive的metastore(元数据管理服务), 因为目前没有配置path环境变量, 需要到hive目录下执行.
[root@node1 ~]# cd /export/server/hive/bin5.后方方式, 启动metastore服务, 不占用当前窗口
[root@node1 bin]# nohup ./hive --service metastore &6.启动hiveserver2服务(需要2~3分钟), 确保你已经成功启动Hadoop集群和metastore服务.
[root@node1 bin]# nohup ./hive --service hiveserver2 &7.通过命令查看hiveserver2服务是否初始化完毕.出现内容即成功启动HIVE
[root@node1 bin]# lsof -i:10000
4.Hive的第2代客户端体验
1. 切换到hive的bin目录下
[root@node1 ~]# cd /export/server/hive/bin2. 启动第2代客户端
[root@node1 ~]# ./beeline -- 敲回车
beeline> !connect jdbc:hive2://node1:10000 -- 敲回车
Connecting to jdbc:hive2://node1:10000
Enter username for jdbc:hive2://node1:10000: root -- 输入账号(可以任意写), 敲回车
Enter password for jdbc:hive2://node1:10000: -- 不用输入, 直接敲回车.
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://node1:10000> -- 可以在这里直接写HiveSQL语句了.0: jdbc:hive2://node1:10000> show databases;
0: jdbc:hive2://node1:10000> use 数据库名;
0: jdbc:hive2://node1:10000> show tables;
0: jdbc:hive2://node1:10000> select * from 表名;
以上就是HIVE入门体验