Hive原理

jiedaodezhuti

于 2025-05-12 21:07:23 发布

阅读量974

点赞数 28

文章标签： hive hadoop 数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiedaodezhuti/article/details/147904887

版权

Hive 是构建在 Hadoop 上的数据仓库工具，其核心原理是通过类 SQL 语言（HiveQL）将结构化数据查询转换为分布式计算任务（如 MapReduce、Tez、Spark），并利用 HDFS 存储数据。以下是 Hive 的核心原理和架构：

1. 核心设计思想‌

‌数据仓库抽象‌：将 HDFS 上的文件抽象为‌表结构‌，提供类 SQL 接口（HiveQL）进行查询。
‌元数据管理‌：通过 ‌Hive Metastore‌ 存储表结构、分区、存储路径等元信息（表名、列类型、文件位置等）。
‌计算与存储解耦‌：数据存储在 HDFS 上，计算由 MapReduce/Tez/Spark 等引擎执行，Hive 仅负责查询解析和任务调度。

‌2. Hive 架构及核心组件‌

Hive 的架构分为以下关键模块：

件	功能描述
‌Hive CLI/Beeline‌	用户交互接口，接收 HiveQL 查询并提交到 Driver。
‌Driver‌	解析、编译、优化查询，生成执行计划并提交到计算引擎（如 YARN）。
‌Compiler‌	将 Hive

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

jiedaodezhuti 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。