Hive体系结构
用户接口主要有三个:CLI,JDBC和WUI
1.CLI,最常用的模式。实际上在>hive 命令行下操作时,就是利用CLI用户接口。
2.JDBC,通过java代码操作,无需启动hiveserver,然后连接操作。
Metastore
Hive将元数据存储在数据库中,如mysql,derby。Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等。
解释器(complier)、优化器(optimizer)、执行器(executor)组件
这三个组件用于:HQL语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中,并随后又MapReduce调用执行。
Hadoop
Hive的数据存储在HDFS,大部分的查询、计算由Mapreduce完成