1.元数据(metastore)包括:
表名、
表所属的数据库(默认是default)、
表的拥有者、
列/分区字段、
表的类型(是否是外部表)、
表的数据所在目录
等;
(注:默认存储在自带的derby数据库中,推荐使用MySQL存储Metastore)
2.其余组成模块:
(1)解析器(SQL Parser):解析HQL语义
(2)编译器(Physical Plan):将HQL根据语义转换成MR程序
(3)优化器(Query Optimizer):对逻辑执行计划进行优化。(对MR程序进行优化)
(4)执行器(Execution):把任务提交到hadoop集群