Impala(二) 架构与原理

本文详细介绍了Impala的架构,包括Impalad、Catalog和Statestore组件,以及其运行时代码生成、I/O管理、存储格式等实现细节。Impala通过避免网络瓶颈、使用统一元数据存储和本地处理来提高查询性能。它还支持多种数据格式,并能与HDFS、HBase等集成。文章还对比了Impala与其他系统在单用户和多用户场景下的性能。
摘要由CSDN通过智能技术生成

概述

image-20200510140758627

  • Thanks to local processing on data nodes, network bottlenecks are avoided.由于对数据节点进行了本地处理,因此避免了网络瓶颈。

  • A single, open, and unified metadata store can be utilized. 可以利用单个,开放和统一的元数据存储。

  • Costly data format conversion is unnecessary and thus no overhead is incurred. 无需进行昂贵的数据格式转换,因此不会产生任何开销。

  • All data is immediately query-able, with no delays for ETL. 所有数据均可立即查询,而ETL没有延迟。

  • All hardware is utilized for Impala queries as well as for MapReduce. 所有硬件均用于Impala查询以及MapReduce。

  • Only a single machine pool is needed to scale. 仅需单个计算机池即可扩展。

  • 详情请查看论文

组件

从上图可以看出,Impala 自身包含三个模块:Impalad、Statestore 和 Catalog,除此之外 它还依赖 Hive Metastore 和 HDFS/Hbase/。

Impalad

  • 接收 client 的请求、Query 执行并返回给中心协调节点;
  • 子节点上的守护进程,负责向 statestore 保持通信,汇报工作。

Catalog

  • 分发表的元数据信息到各个 impalad 中;

  • 接收来自 statestore 的所有请求。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值