大数据—impala元数据

最新推荐文章于 2023-12-29 17:14:13 发布

活到老&学到老

最新推荐文章于 2023-12-29 17:14:13 发布

阅读量1.6k

点赞数

分类专栏：大数据文章标签： big data 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/len9596/article/details/120989360

版权

本文深入探讨了Impala的元数据管理，包括CatalogServer、Statestore Server和ImpalaDaemon的角色，以及元数据的获取和缓存机制。Impala的元数据来源于Hive Metastore和NameNode，通过Statestored进行广播。在生产环境中，推荐对Impalad进行协调器和执行器的角色分离。

摘要由CSDN通过智能技术生成

前言

这里主要介绍了关于Impala如何管理其元数据的原理，方便日后对其进行性能及可拓展性调优。

Impala架构

impala组成架构图如下：
元数据架构

CatalogServer（Catalogd）：负责元数据的获取和DDL的执行
Statestore Server（Statestored）：负责消息/元数据的广播
ImpalaDaemon（Impalad）：负责查询的接收和执行
- coordinator only：查询的接收，计划的生成，查询的调度
- executor only：数据的读取和计算
- coordinator and executor：

注意：生产中impalad建议做好角色分离，每个impalad要么是coordinator要么是excutor。按1:50比例配置。

Impala工作原理

impala外部元数据来源：
1、来自Hive Metastore的目录信息
2、来自NameNode的文件元数据

Impala的元数据缓存在catalogd和各个Coordinator角色的Impalad中。Catalogd中的缓存是最新的，各个Coordinator都缓存的是Catalogd内元数据的一个复本。架构示意图如下：

最低0.47元/天解锁文章

活到老&学到老

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

活到老&学到老 CSDN认证博客专家 CSDN认证企业博客

码龄10年

72: 原创

8万+: 周排名

204万+: 总排名

22万+: 访问

: 等级

2300: 积分

25: 粉丝

14: 获赞

19: 评论

126: 收藏

私信

关注

热门文章

分类专栏

最新评论

工具安装 | docker安装ansible-awx
solihawk: Ansible Tower的使用，参考https://blog.csdn.net/solihawk/article/details/121958909
k8s系列-白话Kubernetes架构
Cdf（人名）: 写的很详细
k8s系列-白话Kubernetes架构
泰山AI: 宋江、卢俊义、吴用、公孙胜、关胜、林冲、秦明、呼延灼、花荣、柴进、李应、朱仝、鲁智深、武松、董平、张清、杨志、徐宁、索超、戴宗、刘唐、李逵、史进、穆弘、雷横、李俊、阮小二、张横、阮小五、张顺、阮小七、杨雄、石秀、解珍、解宝、燕青、朱武、黄信、孙立、宣赞、郝思文、韩滔、彭玘、单廷珪、魏定国、萧让、裴宣、欧鹏、邓飞、燕顺、杨林、凌振、蒋敬、吕方、郭盛、安道全、皇甫端、王英、扈三娘、鲍旭、樊瑞、孔明、孔亮、项充、李衮、金大坚、马麟、童威、童猛、孟康、侯健、陈达、杨春、郑天寿、陶宗旺、宋清、乐和、龚旺、丁得孙、穆春、曹正、宋万、杜迁、薛永、施恩、周通、李忠、杜兴、汤隆、邹渊、邹润、朱富、朱贵、蔡福、蔡庆、李立、李云、焦挺、石勇、孙新、顾大嫂、张青、孙二娘、王定六、郁保四、白胜、时迁、段景柱等108人感觉很赞
linux工具——PPTP搭建及配置
i72896: 请问第三步是什么意思？
python编译Django报错
懵圈树下你和我: 请问什么是电脑名称a？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。