Apache Impala笔记

最新推荐文章于 2024-08-07 09:43:18 发布

Imflash

最新推荐文章于 2024-08-07 09:43:18 发布

阅读量330

点赞数

分类专栏：知识点总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Imflash/article/details/100291965

版权

Apache Impala是一款高效率的SQL查询工具，与Hive共享元数据但避免了MapReduce，提供实时交互查询。它依赖Hive Metastore，支持大部分Hive SQL，但不支持UDF，且内存消耗大，无容错机制。Impala由Impalad、State Store和Catalogd等组件构成，用于集群部署，执行流程包括SQL解析、编译和C++后端执行。安装涉及复杂的YUM源配置和依赖管理。

摘要由CSDN通过智能技术生成

Apache Impala

impla是个实时的sql查询工具，类似于hive的操作方式，只不过执行的效率极高，号称当下大数据生态圈中执行效率最高的sql类软件
impala来自于cloudera，后来贡献给了apache
impala工作底层执行依赖于hive 与hive共用一套元数据存储。在使用impala的时候，必须保证hive服务是正常可靠的，至少metastore开启。
impala最大的跟hive的不同在于不在把sql编译成mr程序执行编译成执行~~计划数~~（勘误：计划树）。
impala的sql语法几乎兼容hive的sql语句。

impala优缺点

优点：
- 不经过MapReduce
- 直接操作HDFS数据
- 查询数据采用拉的方式
- 交互式–实时
缺点
- 完全依赖于hive的meatstore
- 容错–无容错
- 消耗内存大
- 底层使用的C++，不支持UDF

impala是一个适用于实时交互查询的sql软件 hive适合于批处理查询的sql软件。通常是两个互相配合。

impala 可以集群部署
- Impalad(impala server):可以部署多个不同机器上，通常与datanode部署在同一个节点方便数据本地计算，负责具体执行本次查询sql的impalad称之为Coordinator。每个impala server都可以对外提供服务。
- impala state store:主要是保存impalad的状态信息监视其健

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。