Impala 简介

最新推荐文章于 2022-10-24 20:55:52 发布

数据源的港湾

最新推荐文章于 2022-10-24 20:55:52 发布

阅读量1.2k

点赞数 1

分类专栏：大数据

大数据专栏收录该内容

84 篇文章 5 订阅

订阅专栏

Impala是Hadoop之上的一款SQL查询引擎。使用Impala，可以通过标准SQL语法如SELECT、JOIN及聚合函数等实时地查询Hadoop上的数据（HDFS数据或者是HBase中的数据）。Impala使用和Apache Hive同样的metadata，SQL 语法（Hive SQL），ODBC驱动及Hue接口，提供一个面向批处理或实时查询的统一平台。（因而Hive用户可以很方面的去使用Impala）

架构
Impala绕过了MapReduce，通过分布式的类似于关系型数据库中查询引擎直接查询HDFS上的数据，从而比Hive有更高的性能，因为Hive的执行是转换为MapReduce操作，而MapReduce的响应延迟较高。下图是Impala的架构，

这里写图片描述

Impala主要由三种服务组成，
1 Impalad
接收客户端请求并安排在集群上执行，同时执行从其他 Daemon上发来的单个执行片。Impala部署在集群的DataNode上，可允许Impala利用数据本地化的特点而不必通过网络传输即可在文件系统中读取数据块。

2 Statestored
Impala的元数据订阅-发布服务，单一实例，将集群元数据传播到所有Impala进程。

3 Catalogd
Impala的目录资源库与元数据的访问网关，通过它，Impala可执行DDL命令且与外部元数据存储如Hive MetaStore同步。

关于Imapla的使用，见后续文章~

数据源的港湾

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

数据源的港湾 CSDN认证博客专家 CSDN认证企业博客

码龄8年

504: 原创

12万+: 周排名

164万+: 总排名

138万+: 访问

: 等级

1万+: 积分

249: 粉丝

625: 获赞

128: 评论

771: 收藏

私信

关注

热门文章

分类专栏

最新评论

分布式一致性问题之混合逻辑时钟
nn_wai: 你这个第二版算法的if条件判断根本不对，else if pt.j <= l.j and l.m <= l.j then c.j = c.j + 1，如果pt.j < l.j && l.m==l.j呢，这时候要比较c.j 和c.m，原论文的判断条件避免了这种边界的case情况，文中的三个case无非就是想判断哪个的物理时钟是最大的，但是忽略了两两相等的边界case
TDH（Transwarp Data Hub）社区版安装教程
星环科技TDH社区版: 前段时间TDH社区版重新重磅推出，同时还推出了单机即可30秒一键启动的社区开发版，具体可以访问下方链接获取更多社区版相关资源：https://community.transwarp.cn/article/detail?id=247
TDH（Transwarp Data Hub）社区版安装教程
星环科技TDH社区版: 前段时间社区版重新重磅推出，同时还推出了单机即可30秒一键启动的社区开发版，具体可以访问下方链接获取更多社区版相关资源：https://community.transwarp.cn/article/detail?id=247
Oracle ADG的基本概念
FC-Barcelona: 您好，请教一下两个疑问 1、 “以介质恢复的方式”指的啥。 2、最大保护模式下提供的是物理备库吗。
PostgreSQL之堆表存储（Heap Table）
RE:无影人: 好顶赞！多谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。