【赵渝强老师】Hive的体系架构-CSDN博客

本文链接：https://blog.csdn.net/zhaoyuqiang/article/details/140842331

在这里插入图片描述
在Hadoop体系中提供数据分析引擎Hive。它允许使用SQL语句来分析处理数据，而不需要编程复杂的Java程序。同时Hive提供了丰富的数据模型来创建各种表结构，帮助数据分析人员建立数据模型。视频讲解如下：

Hive的体系架构

【赵渝强老师】Hive的体系架构

Hive是基于Hadoop之上的数据仓库平台，提供了数据仓库的相关功能。Hive最早起源于FaceBook，2008年FaceBook将Hive贡献给了Apache，成为了Hadoop体系中的一个组成部分。Hive支持的语言是HQL语言，即：Hive Query Language，它是SQL语言的一个子集。随着Hive版本的提高，HQL语言支持的SQL语法也会越来越多。从另一个方面来看，可以把Hive理解为一个翻译器，默认的行为是Hive on MapReduce，也是在Hive中执行的HQL语句会被转换成一个MapReduce任务运行在Yarn之上，从而处理HDFS中的数据。下表对比的它们之间的对应关系。
在这里插入图片描述
Hive的底层主要依赖于HDFS和Yarn。Hive将数据存入HDFS中，并将执行的SQL语句转换成MapReduce运行在Yarn上。下图说明了Hive的体系架构。

Hive的核心是其执行引擎Hive Driver，可以把它理解成是一个翻译器。通过Hive Driver可以把SQL语句转换成MapReduce处理HDFS中的数据。由于Hive需要将数据模型的元信息保存下来，因此Hive需要一个关系型数据库的支持，官方推荐使用MySQL来存储Hive的元信息。