HIVE数据仓库（入门）

最新推荐文章于 2024-07-20 22:06:32 发布

Winner_D

最新推荐文章于 2024-07-20 22:06:32 发布

阅读量337

点赞数 10

文章标签：数据仓库 hive hadoop

本文链接：https://blog.csdn.net/Winner_D/article/details/135512016

版权

本文介绍了Hive的基本概念，包括其作为分布式SQL工具的意义，Hive架构，以及如何在Hadoop集群上安装和启动Hive服务，如Metastore和HiveServer2，以及使用Hive的第二代客户端beeline进行交互和执行SQL查询。

摘要由CSDN通过智能技术生成

1.hive简介

什么是分布式SQL?

通过分布式的方式, 执行SQL语句, 获取分析结果

学习hive的意义

1. 通过Java 或者 Python直接操作MapReduce, 也可以做分析, 但是开发难度稍大

2.通过SQL做分析, 相对简单易上手

3.Hive就是让我们写类SQL语法, 然后Hive底层会将其解析成MR任务来执行

2.HIVE架构图示（手动@夯哥）

3.HIVE初体验

启动Hive服务

1.首先启动Hadoop集群

[root@node1 ~]# start-all.sh

2.然后启动历史服务

[root@node1 ~]# mr-jobhistory-daemon.sh start historyserver

3.分别在node1, node2, node3三台机器中, 执行jps命令, 查看启动的Hadoop集群节点.
[root@node1 ~]# jps

4.启动hive的metastore(元数据管理服务), 因为目前没有配置path环境变量, 需要到hive目录下执行.
[root@node1 ~]# cd /export/server/hive/bin

5.后方方式, 启动metastore服务, 不占用当前窗口
[root@node1 bin]# nohup ./hive --service metastore &

6.启动hiveserver2服务(需要2~3分钟), 确保你已经成功启动Hadoop集群和metastore服务.
[root@node1 bin]# nohup ./hive --service hiveserver2 &

7.通过命令查看hiveserver2服务是否初始化完毕.出现内容即成功启动HIVE
[root@node1 bin]# lsof -i:10000

4.Hive的第2代客户端体验

1. 切换到hive的bin目录下
[root@node1 ~]# cd /export/server/hive/bin

2. 启动第2代客户端
[root@node1 ~]# ./beeline       -- 敲回车
beeline> !connect jdbc:hive2://node1:10000   -- 敲回车
Connecting to jdbc:hive2://node1:10000
Enter username for jdbc:hive2://node1:10000: root   -- 输入账号(可以任意写), 敲回车
Enter password for jdbc:hive2://node1:10000:        -- 不用输入, 直接敲回车.
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://node1:10000> -- 可以在这里直接写HiveSQL语句了.

0: jdbc:hive2://node1:10000> show databases;

0: jdbc:hive2://node1:10000> use 数据库名;

0: jdbc:hive2://node1:10000> show tables;

0: jdbc:hive2://node1:10000> select * from 表名;

以上就是HIVE入门体验

Winner_D

关注

10
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
HIVE数据仓库（入门）

什么是分布式SQL?通过分布式的方式, 执行SQL语句, 获取分析结果学习hive的意义1. 通过Java 或者 Python直接操作MapReduce, 也可以做分析, 但是开发难度稍大2.通过SQL做分析, 相对简单易上手3.Hive就是让我们写类SQL语法, 然后Hive底层会将其解析成MR任务来执行。
复制链接

扫一扫