Hive是基于Hadoop的数据仓库,使用HQL作为查询接口、HDFS作为存储底层、mapReduce作为执行层, 基于Hadoop平台解决了企业数据仓库构建的核心技术问题,证明了Hadoop平台的强大。从而进一步降低了Hadoop使用的准入门槛。
以下为hive的架构设计与运行流程
.用户接口主要有三个:CLI命令行,Client 和 Web UI
.metaStore: hive 的元数据结构描述信息库,可选用不同的关系型数据库来存储,通过配置文件修改、查看数据库配置信息
.Driver: hive核心驱动器接口类,衔接UI与内核的解析、优化、执行器的桥梁,生成的查询计划存储在HDFS中,并在随后由MapReduce调用执行
hive模块详情介绍