Hive简介

最新推荐文章于 2021-11-08 10:40:55 发布

qq_34795664

最新推荐文章于 2021-11-08 10:40:55 发布

阅读量181

点赞数

分类专栏： hive 文章标签： hive简介

本文链接：https://blog.csdn.net/qq_34795664/article/details/79942401

版权

3 篇文章 0 订阅

订阅专栏

Apache Hive

用户接口：包括 CLI、JDBC/ODBC、WebGUI。其中，CLI(command lineinterface)为 shell 命令行；JDBC/ODBC 是 Hive 的 JAVA 实现，与传统数据库JDBC 类似；WebGUI 是通过浏览器访问 Hive。
元数据存储：通常是存储在关系数据库如 mysql/derby 中。Hive 将元数据存储在数据库中。Hive 中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等。
解释器、编译器、优化器、执行器:完成 HQL 查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在 HDFS 中，并在随后有 MapReduce 调用执行。

Hive 利用 S HDFS 存储数据，利用 e MapReduce 查询分析数据。

hive 用于海量数据的离线数据分析。
hive 具有 sql 数据库的外表，但应用场景完全不同，hive 只适合用来做批量数据统计分析。
更直观的对比请看下面这幅图：

Hive 中所有的数据都存储在 HDFS 中，没有专门的数据存储格式在创建表时指定数据中的分隔符，Hive 就可以映射成功，解析数据。

关注