一、Hive是什么?
Hive:由 Facebook 开源用于解决 海量结构化日志 的数据统计。
Hive 是基于 Hadoop 的一个 数据仓库工具,可以将 结构化的数据文件映射为一张表,并且提供 类SQL 查询功能。
二、Hive本质是什么?
Hive 的本质是将 HQL 转化成 MapReduce 程序,Hive 储存的数据在 HDFS 上,Hive 分析数据底层的 默认实现 是 MapReduce,Hive 的执行程序在 Yarn 上。HQL 转换 MR 的流程图如下:
三、Hive架构原理
1、用户接口:Client
CLI(hive shell)、JDBC/ODBC(java 访问 hive)、WEBUI(浏览器访问 hive)
2、元数据:Metastore
元数据包括: