Hive内容分享(十)：Hive MetaStore 在快手遇到的挑战与优化

之乎者也·

于 2024-01-04 08:05:27 发布

阅读量933

点赞数 16

分类专栏： Hive 内容分享大数据（Hadoop）内容分享文章标签： hive hadoop 数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45038038/article/details/135298270

版权

目录

快手SQL on Hadoop智能引擎架构

Hive MetaStore在快手的挑战

Hive MetaStore在快手的优化

1. MetaStore读写分离架构设计

2. MetaStore API优化

3. MetaStore流量控制架构设计

4. MetaStore Federation架构设计

快手SQL on Hadoop智能引擎架构

Apache Hive是由Facebook开源的数据仓库系统，提供SQL查询能力，快手基于Hive搭建数据仓库，随着业务迅速发展和数据规模增长，Hive的性能开始成为瓶颈，无法满足业务需求。

Hive把用户SQL通过解释器转换为一系列MR作业提交到hadoop环境中运行，MR存在作业启动、调度开销大、落盘多磁盘IO重的问题，这导致其性能注定无法太好，针对Hive查询速度慢的问题，业界先后推出了包括presto/impala/spark等查询引擎，在实现和适用场景上各有优缺点。

在计算引擎层面我们所面临的几个挑战是：

高性能：业务要求更高的查询性能，需要引入更高效的计算引擎
易用性：由于不同引擎在语法以及适用场景上各有优缺点，对于业务来说存在学习和使用门槛，需要通过技术手段来降低或者消除这种门槛
扩展性：技术是发展非常快的，未来随着技术发展可能还会有其他更高效的引擎不断出现，我们在架构设计上需要能够考虑到很好地扩展性支持这些新的计算引擎，需要做到计算引擎的可插拔、易扩展
低成本：围绕Hive我们构建了大量周边工具及服务，包括资源管理、血缘管理、权限控制等各个方面。如果每引入一个引擎都再各自开发一套周边工具及服务的建设会是一个非常昂贵的事，所以这一块需要做到低成本接入

基于上述考虑，我们最终基于HiveServer本身的Hook架构，实现一个BeaconServer。所有的查询仍然以HiveServer作为统一入口，从而解决易用性和低成本的问题。

BeaconServer作为后端Hook Server服务，配合HS2中的Hook，在HS2 服务之外实现了所需的功能，包括根据一定规则路由SQL到适当的引擎，从而起到查询加速的效果。当前支持的模块包括路由、审计、SQL 重写、错误分析、优化建议等。

BeaconSer

最低0.47元/天解锁文章

博客等级

码龄6年

1457
原创

2万+
点赞

2万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

大数据内容分享(十一)：OPPO大数据诊断平台设计与实践
zhu.hh: 大佬你这个篇文章的，具体任务cpu和内存的量化公式是从什么地方得到的，能提供下参考文章或者参考文献吗
大模型内容分享(二十)：大模型最全八股(五)
Dubai——embrace: 这个是AI输出的，不好保证正确性吧
架构设计内容分享(一百九十八)：菱形对称架构的演进、定义和价值
a415473410: 正在学习领域驱动设计，关于菱形架构对ddd的实现方案，我觉得是对开发者最友好的方案，也有助于在团队的不同级别开发者间中形成可相互认可的模式，并在概念上形成可讨论的空间。我想表达的是横看成岭侧成峰这样一种感觉，就是合格的开发者都能很快的融入这种开发框架中。我是DDD的初学者，当前正在学习菱形架构，并尝试用这个方案对公司的微服务架构做一次改进，做为后续项目的基础框架。我在学习的过程中遇到了非常多的问题，直到读了大神的佳作，其中对案例的辩证分析，解开了我的一些疑问。大神对概念的引用也恰到好处，感觉非常通透。期待大神能在git上分享一个案例DEMO（按照相对理想的设计模型），这样应该能够在很多细节上有足够的指导。主要是我在尝试按照菱形对称架构的方式去编码时，总有种邯郸学步的感觉，可能是我对领域服务和界限上下的理解上有偏差，找不到专家只能自己摸索，而搜索到的大部分博客都是讲概念的，偶尔有实例又在概念上落地问题很大
AI 内容分享(二十五)：生成式人工智能与未来教育形态重塑
qq_23078315: 你引用可以，标记为你的原创就是你的不对了。这篇来自我的单位——讯飞教育技术研究院24年初发表在电化教育研究的论文《生成式人工智能与未来教育形态重塑：技术框架、能力特征及应用趋势》
设计模式内容分享(十)：组合模式
喛，。: 组合模式的扩展：分别多态了抽象的树叶或树枝构件，这不就是封装了的安全组合。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

之乎者也· 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。