1. Hive的体系结构
-
Hadoop
用HDFS进行存储,利用MapReduce进行计算
-
元数据存储(MetaStore)
通常是存储在关心数据库,如mysql、derby中
在Hive执行HQL语句,其HQL语句会被解析成一个MapReduce作业,并提交到Hadoop集群上进行运行,得到的结果返回给客户端程序,这个过程主要是由JobTracker进行任务调度。
2. Hive的体系结构之元数据
Hive的元数据
元数据与表中存储的具体数据无关,反映的是表本身的信息,这种信息就是元信息,即元数据。
-
Hive将元数据存储在数据库中(metastore),支持mysql、derby、oracle等数据库
默认采用derby数据库来存储Hive的元数据
-
Hive中的元数据包括表的名字、表的列和分区及其属性、表的属性(是否为外部表等)、表的数据所在目录等