Hive多用户模式搭建

最新推荐文章于 2023-03-26 11:15:01 发布

SunnyRivers

最新推荐文章于 2023-03-26 11:15:01 发布

阅读量1.5k

点赞数

分类专栏： Hive 文章标签： hive多用户模式搭建 hive远程服务模式搭建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Android_xue/article/details/80143832

版权

Hive 专栏收录该内容

22 篇文章 3 订阅

订阅专栏

多用户模式也称远程服务模式，用户非java客户端访问元数据库，在服务端启动MetaStoreServer，客户端利用Thrift协议通过MetaStoreServer访问元数据库。

使用hive多用户模式前提：

（1）启动hadoop集群

（2）启动mysql服务

节点规划：

hadoop01作为mysql服务，用来存放元数据信息

hadoop03作为hive服务端

hadoop04作为hive客户端

搭建步骤：

1. 把hive的jar包通过远程发送给hadoop03、hadoop04

解压后配置环境变量（步骤和之前一样）

2. 配置服务端hadoop03中的hive-site.xml文件

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

<property>

<name>hive.metastore.warehouse.dir</name>

<value>/user/hive/warehouse</value>

</property>

<property>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://hadoop01:3306/hive?createDatabaseIfNotExist=true</value>

</property>

<property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

</property>

<property>

<name>javax.jdo.option.ConnectionUserName</name>

<value>root</value>

</property>

<property>

<name>javax.jdo.option.ConnectionPassword</name>

<value>123</value>

</property>

</configuration>

3. hadoop03作为服务端需要连接mysql所以也要mysql的驱动jar包

4. 启动服务端

hive --service metastore

发现阻塞在这里了

因为客户端正在监听它，那么监听它的端口是多少呢？9083

ss -nal命令查看

5. 配置客户端hadoop04中的hive-site.xml文件：

客户端：

<property>

<name>hive.metastore.warehouse.dir</name>

<value>/user/hive/warehouse</value>

</property>

<property>

<name>hive.metastore.local</name>

<value>false</value>

</property>

<property>

<name>hive.metastore.uris</name>

<value>thrift://hadoop03:9083</value>

</property>

6. 由于客户端需要执行hive操作（换句话说谁需要请求server谁就需要把jline进行替换），所以需要把hive中jline的jar包拷贝到hadoop的

(/opt/software/hadoop-2.6.5/share/hadoop/yarn/lib/)目录的下，并把其中低版本的删掉，不然会报错。

7.在客户端hadoop04上执行hive操作：

hive> create table test02(id int,age int);

OK

Time taken: 2.84 seconds

hive> insert into test02 values(2,24);

Query ID = root_20180429235125_dd6de207-0551-4cf3-9e43-c366b4cbdbd1

Total jobs = 3

Launching Job 1 out of 3

Number of reduce tasks is set to 0 since there's no reduce operator

Starting Job = job_1525003393708_0002, Tracking URL = http://hadoop03:8088/proxy/application_1525003393708_0002/

Kill Command = /opt/software/hadoop-2.6.5/bin/hadoop job -kill job_1525003393708_0002

Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0

2018-04-29 23:51:53,973 Stage-1 map = 0%, reduce = 0%

2018-04-29 23:52:10,357 Stage-1 map = 100%, reduce = 0%, Cumulative CPU 2.33 sec

MapReduce Total cumulative CPU time: 2 seconds 330 msec

Ended Job = job_1525003393708_0002

Stage-4 is selected by condition resolver.

Stage-3 is filtered out by condition resolver.

Stage-5 is filtered out by condition resolver.

Moving data to: hdfs://mycluster/user/hive/warehouse/test02/.hive-staging_hive_2018-04-29_23-51-25_850_3672183876211142123-1/-ext-10000

Loading data to table default.test02

Table default.test02 stats: [numFiles=1, numRows=1, totalSize=5, rawDataSize=4]

MapReduce Jobs Launched:

Stage-Stage-1: Map: 1 Cumulative CPU: 2.33 sec HDFS Read: 3527 HDFS Write: 75 SUCCESS

Total MapReduce CPU Time Spent: 2 seconds 330 msec

OK

Time taken: 47.009 seconds

hive>

在webui中查看：

使用命令查看hdfs文件：

数据库查看元数据的方式和之前一样

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hive多用户模式搭建

多用户模式也称远程服务模式，用户非java客户端访问元数据库，在服务端启动MetaStoreServer，客户端利用Thrift协议通过MetaStoreServer访问元数据库。使用hive多用户模式前提：（1）启动hadoop集群（2）启动mysql服务节点规划：hadoop01作为mysql服务，用来存放元数据信息hadoop03作为hive服务端hadoop04作为hive客户端搭建步骤：...
复制链接

扫一扫

专栏目录

SunnyRivers

CSDN认证博客专家 CSDN认证企业博客

码龄8年

大数据领域优质创作者

305: 原创

2670: 周排名

2607: 总排名

94万+: 访问

: 等级

9749: 积分

2万+: 粉丝

748: 获赞

163: 评论

2331: 收藏

私信

关注

热门文章

分类专栏

最新评论

第七章线性回归预测模型
嗦嘎Math: 可以再分享一下这本书的源代码吗，链接过期了
Python爬虫之（九）数据提取-XPath
好孩纸929: 谓语部分有个单词错了，position写成positon
SparkSQL性能优化终极篇
SunnyRivers: 请问一下是哪里写的有问题或者有更好的优化思路吗？有的好的思路欢迎提供，感谢！
Hive导入和导出数据
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数。
如何评估RDD和DataFrame的大小
SunnyRivers: 我的锅，这个方法容易误导人，不要用这个方法了，我把它删掉了。平时生产中我更多的是先把rdd或dataframe缓存到内存，然后通过WebUI去查看具体占用了多大内存。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SunnyRivers 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。