大数据技术的对决——Spark对Impala对Hive对Presto

最新推荐文章于 2024-03-21 11:51:45 发布

b10l07

最新推荐文章于 2024-03-21 11:51:45 发布

阅读量534

点赞数

文章标签：大数据

原文链接：https://yq.aliyun.com/articles/187973

版权

在大数据浪潮全面来袭的历史背景下，我们一直面临着同一类难题的困扰——该选择哪款工具解决相关问题?这项挑战在大数据SQL引擎领域同样存在。作为大数据报告工具开发商，AtScale公司通过基准测试为我们带来了如下答案：

1. Spark 2.0在大规模查询性能方面可达1.6版本的2.4倍。二者的小规模查询性能基本持平。

Spark 2.0 improved its large query performance by an average of 2.4X over Spark 1.6 (so upgrade!). Small query performance was already good and remained roughly the same.

2. Impala 2.6版本在大规模查询性能可达2.3版本的2.8倍，小规模查询基本持平。

Impala 2.6 is 2.8X as fast for large queries as version 2.3. Small query performance was already good and remained roughly the same.

3. Hive 2.1配合LLAP在大规模查询场景下可实现1.2版本性能的3.4倍，小规模查询性能则为2倍。

Hive 2.1 with LLAP is over 3.4X faster than 1.2, and its small query performance doubled. If you're using Hive, this isn't an upgrade you can afford to skip.

本文作者：佚名

来源：51CTO

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

b10l07

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据技术的对决——Spark对Impala对Hive对Presto

在大数据浪潮全面来袭的历史背景下，我们一直面临着同一类难题的困扰——该选择哪款工具解决相关问题?这项挑战在大数据SQL引擎领域同样存在。作为大数据报告工具开发商，AtScale公司通过基准测试为我们带来了如下答案：1. Spark 2.0在大规模查询性能方面可达1.6版本的2.4倍。二者的小规模查询性能基本持平。Spark 2.0 impro...
复制链接

扫一扫