1、Impala的理论基础Dremel
(1)Dremel:基于GFS、MR和bigTable的分析引擎。在论文中,1PB数据3秒可以处理完。
2、Impala的架构
(1)Impala Daemon:包括Query Planner、Query Coordinator、Execution和HDFS和HBase。
也就如下图:
(2)Impala Daemon功能:Query Planner,SQL解析,生成语法树,由Java实现;Query Coordinator,协调本机和其它机器的执行计划;Execution Engine执行具体的操作。
(3)Satestore Server:监控impala Daemon的存活状态。管理真个集群的cluster。
(3)catastore Server:提供元数据存储的位置。向节点提供