最近在内部做了个分享,顺便画了一下这次impala数据血缘的架构图:
架构图:
如果想了解如何实现请参照前面几篇文章:
impala数据血缘与数据地图系列:
---------------------------------Impala血缘 架构图-----------------------------------------------------------
红色部分是用户会接触到的部分,绿色部分对于用户无感知。
解读:
1. impala是无主的MPP架构,因此用户每次SQL指定的impala节点就是主节点,当用户通过SQL或jdbc/odbc接口查询impala时,SQL命令首先 会发送到impala daemon节点,由该节点的QueryPlanner解析SQL成执行计划后发送给其他daemon节点分别计算各自的数据然后返回给该impala daemon节点。 所以我们只要在每台impal