HIVE数据仓库(入门)

本文介绍了Hive的基本概念,包括其作为分布式SQL工具的意义,Hive架构,以及如何在Hadoop集群上安装和启动Hive服务,如Metastore和HiveServer2,以及使用Hive的第二代客户端beeline进行交互和执行SQL查询。
摘要由CSDN通过智能技术生成

1.hive简介

什么是分布式SQL?

通过分布式的方式, 执行SQL语句, 获取分析结果

学习hive的意义

1. 通过Java 或者 Python直接操作MapReduce, 也可以做分析, 但是开发难度稍大

2.通过SQL做分析, 相对简单易上手

3.Hive就是让我们写类SQL语法, 然后Hive底层会将其解析成MR任务来执行

2.HIVE架构图示(手动@夯哥) 

 3.HIVE初体验

启动Hive服务

1.首先启动Hadoop集群

[root@node1 ~]# start-all.sh

2.然后启动历史服务

[root@node1 ~]# mr-jobhistory-daemon.sh start historyserver

3.分别在node1, node2, node3三台机器中, 执行jps命令, 查看启动的Hadoop集群节点.
[root@node1 ~]# jps

4.启动hive的metastore(元数据管理服务), 因为目前没有配置path环境变量, 需要到hive目录下执行.
[root@node1 ~]# cd /export/server/hive/bin

5.后方方式, 启动metastore服务, 不占用当前窗口
[root@node1 bin]# nohup ./hive --service metastore &

6.启动hiveserver2服务(需要2~3分钟), 确保你已经成功启动Hadoop集群和metastore服务.
[root@node1 bin]# nohup ./hive --service hiveserver2 &

7.通过命令查看hiveserver2服务是否初始化完毕.出现内容即成功启动HIVE
[root@node1 bin]# lsof -i:10000

 4.Hive的第2代客户端体验

1. 切换到hive的bin目录下
[root@node1 ~]# cd /export/server/hive/bin

 2. 启动第2代客户端
[root@node1 ~]# ./beeline        -- 敲回车
beeline> !connect jdbc:hive2://node1:10000    -- 敲回车
Connecting to jdbc:hive2://node1:10000
Enter username for jdbc:hive2://node1:10000: root    -- 输入账号(可以任意写), 敲回车
Enter password for jdbc:hive2://node1:10000:         -- 不用输入, 直接敲回车.
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://node1:10000> -- 可以在这里直接写HiveSQL语句了.

0: jdbc:hive2://node1:10000> show databases;

0: jdbc:hive2://node1:10000> use 数据库名;

0: jdbc:hive2://node1:10000> show tables;

0: jdbc:hive2://node1:10000> select * from 表名;

 以上就是HIVE入门体验

  • 10
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值