大数据SQL引擎

Presto的整体架构

Presto CLI

Presto Coordinator

Presto Worker

元数据 存储在Hive中,Metastore中 Catalog

Impala SQL的解析引擎, 不依赖MR,依赖Hive中的元数据,编译为执行计划树,省去了大量的shuffle的

尽可能使用内存,底层使用C++代码来执行,不支持UDF

Impala不依赖Yarn进行调度

Google 新三驾马车 (Caffeine – 网络搜索引擎,Pregel – 分布式图计算, Dremel – 交互式分析工具)

impala参考Google的Dremel实现了

Impala的整体架构

  • CLI: Impala shell ,hua,jdbc,odbc,客户端端

  • Impalad: Impalad Server,通常和DataNode部署在相同的节点,接收到请求之后,称为Coordinator,包括(Planner,Coordinator,Exec Engine)获取元数据,生成执行计数树

    • 1、CLI 提交的SQL语句到指定的Impalad,此节点Impalad称为Coordinator。
    • 2、Coordinator的前端调用JNI编译SQL语句,生成执行计划树,以Thrift数据格式返回给Coordinator的C++后端,执行计数树分为多个阶段,每个阶段叫PlanFragment,
    • 3、Coordinator后端通过libhdfs访问数据所在节点,调用数据所在节点的Impalad节点,进行数据处理
    • 4、将结果放回给Coordinator前端,再返回给CLI
  • Impala State Store:保存Impalad的信息、状态,每个Impalad都缓存一份StateStore中的信息

  • Catelogd:impala的元数据网关,与metestore的同步元数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值