Impala原理和基本使用

最新推荐文章于 2024-08-07 12:00:09 发布

fullfresh

最新推荐文章于 2024-08-07 12:00:09 发布

阅读量461

点赞数

文章标签： hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45140946/article/details/129310651

版权

Impala是一款高性能、低延迟的大数据查询引擎，适用于PB级数据的实时分析。它基于Hive，利用内存计算，提供对HDFS、HBase数据的交互式SQL查询。Impala由Impalad（协调者）、State Store（状态存储）和Catalog（元数据管理）组成，与Hive共享元数据，但避免了MapReduce的繁琐，通过拉取方式提高数据流效率，适合快速交互式查询。尽管不支持某些Hive功能，如alter database，但Impala与Hive配合使用，能够实现高效的数据预处理和实时查询。

摘要由CSDN通过智能技术生成

impala
原理和基本使用
提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。
基于Hive，使用内存计算，兼顾数据仓库、具有实时、批处理、多并发等优点。
是CDH平台首选的PB级大数据实时查询分析引擎。
在这里插入图片描述

相互配合体现在：Hive做数据的预处理，然后impala做实时数据查询
Impala的优缺点
在这里插入图片描述

Impala的组成
在这里插入图片描述

Impalad：本来都是普通的impalad进程，当接收用户请求时，就变成了Coordinator协调者，针对这次请求，他就负责后续的协调处理，接收请求，编译查询计划树，调用其他的impalad进行数据的查询
State store：状态存储，当在多个机器上部署impala的时候，保存每个impalad的健康状况以及它们的位置信息，impalad会和state store进行心跳感应，汇报信息，我是成功的还是失败的，每

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Impala原理和基本使用

Impala原理和基本使用
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。