1、Hive架构
Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。
用户接口:Client
CLI(hive shell)⃝JDBC/ODBC(java 访问 hive)⃝WEBUI(浏览器访问 hive)
元数据:Metastore
元数据包括:表名、表所属的数据库(默认是 default)表的所有者 列/分区字段 表的类型(是否是外部表)表的数据所在目录等;
默认存储在自带的 derby 数据库中,推荐使用 MySQL 存储 Metastore
Hadoop
使用 HDFS 进行存储,使用 MapReduce 进行计算⃞
驱动器:Driver
(1)解析器(SQL Parser):将 SQL 字符串转换成抽象语法树 AST,这一步一般都用 第三方工具库完成