HIVE2.1 vs impala

最新推荐文章于 2024-05-14 07:15:55 发布

JLOGAN

最新推荐文章于 2024-05-14 07:15:55 发布

阅读量1.1k

点赞数 1

分类专栏：大数据工具文章标签： HIVE IMPALA LLAP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ASSaSSINangJIE/article/details/81057649

版权

HIVE2.0增加了LLAP（低延迟分析处理），并在2.1版本进行了改进，相较于HIVE 1有了25倍的查询性能提升。LLAP以多线程方式采用内存进行计算。智能地将数据缓存到多台机器内存中，并允许所有客户端共享这些缓存的数据，同时保留了弹性伸缩能力。详见官网

LLAP采用缓存持久化查询来避免较长的启动时间；
内存查询，并在所有SQL用户之间共享；
细粒度的资源管理和占有，适合多用户高并发操作；

Carter Shanklin & Nita Dembla将其与另外一个SQL on Hadoop 查询引擎impala进行了比较

环境：相同硬件和数据集。其中impala通过CDH5.8版本引入，impala版本为2.6.0，Impala的运行时过滤功能已针对此测试中的所有查询启用。

数据集： HIVE在ORC格式下效果最好，impala在Parquet格式下效果最好，所以impala采用Parquet格式，采用snappy压缩。采用相同的分区方式。

查询：impala本意设计为与HIVE高度兼容，但是由于SQL奇偶校验问题，impala中出现了语法错误的查询。查询时间采用相同的计量标准。

运行时间比较

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HIVE2.1 vs impala

HIVE2.0增加了LLAP（低延迟分析处理），并在2.1版本进行了改进，相较于HIVE 1有了25倍的查询性能提升。LLAP以多线程方式采用内存进行计算。智能地将数据缓存到多台机器内存中，并允许所有客户端共享这些缓存的数据，同时保留了弹性伸缩能力。详见官网LLAP采用缓存持久化查询来避免较长的启动时间；内存查询，并在所有SQL用户之间共享；细粒度的资源管理和占有，适合多用户高并发操作；...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。