HiveServer如何支持高并发架构浅析

最新推荐文章于 2023-03-26 08:25:25 发布

跃ge

最新推荐文章于 2023-03-26 08:25:25 发布

阅读量670

点赞数 1

文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jhkkhtd/article/details/118029554

版权

收录于话题

#大数据常用技术15

#大数据17

Hive是大数据生态必不可少的数据仓库服务，我们能使用很简单的sql命令执行分布式查询任务，后端可以对接MR、TEZ、SPARK分布式查询引擎。高性能是衡量分布式的指标，为了对hive能更高效的使用，我们有必要研究其线程模型是如何支持高并发的。我们以Beeline和HiveServer为入口分析下客户端和服务端执行流程。

一、HiveServer执行解析。

首先看下service接口及其继承类

其中Hive Server2->Composite Service->AbstractService->Service是我们分析的主线。CLiService用于对客户端收到的sql命令进行异步提交到后端集群（MR、SPARK、TEZ)，Session Manager是用于客户端会话管理，并在初始化中创建一个backgroupthreadPool。ThriftBinaryCLIService用于创建线程接收并处理客户端连接。

看下HiveServer2的初始化定义。

此函数内部定义了ThriftBinaryCLIService和CLiService。直接看下ThriftBinaryCLIService的run函数代码：

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HiveServer如何支持高并发架构浅析

原创马申跃架构与英文收录于话题#大数据常用技术15#大数据17Hive是大数据生态必不可少的数据仓库服务，我们能使用很简单的sql命令执行分布式查询任务，后端可以对接MR、TEZ、SPARK分布式查询引擎。高性能是衡量分布式的指标，为了对hive能更高效的使用，我们有必要研究其线程模型是如何支持高并发的。我们以Beeline和HiveServer为入口分析下客户端和服务端执行流程。一、HiveServer执行解析。首先看下service接口及其继承类其中Hive Ser...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。