Hive
bibithink
这个作者很懒,什么都没留下…
展开
-
Hive (一) 简介
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的 sql 查询功能,可以将 sql 语句转换为 MapReduce 任务进行运行。 其优点是学习成本低,可以通过类 SQL 语句快速实现简单的 MapReduce 统计,不必开发专门的 MapReduce 应用,十分适合数据仓库的统计分析。 适用场景 Hive 的最佳...原创 2015-12-10 11:51:51 · 88 阅读 · 0 评论 -
Hive (二) 系统架构
下图是 hive 系统的整体结构图 Hive 体系结构 上图显示了 Hive 的主要组件以及 Hive 跟 Hadoop 的交互过程,这些组件分别是: UI:用户提交查询和其他操作到系统的用户接口。 Driver:接收查询的组件,负责 session 管理,提供基于 JDBC/ODBC 接口的执行和数据拉取 API。 Compiler:解析查询,对查询的不同部分做语法分析,生...2015-12-10 13:53:39 · 164 阅读 · 0 评论