(一）入门

joyboysimba

于 2023-07-23 16:49:29 发布

阅读量53

点赞数

分类专栏： Hive 文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_48590589/article/details/131880781

版权

Hive 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Hive是Facebook基于Hadoop开发的数据仓库工具，它允许用户通过类SQL查询语言HQL处理大数据。Hive中的数据存储在HDFS，查询由MapReduce（或可选的Spark、Tez）执行。元数据存储在Metastore，通常推荐使用MySQL以支持多用户。解析器、优化器和执行器负责处理查询的生命周期，从SQL解析到生成执行计划并返回结果。

摘要由CSDN通过智能技术生成

1.简介

Hive是由Facebook开源，基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。

Hive是一个Hadoop客户端，用于将HQL（Hive SQL）转化成MapReduce程序。

（1）Hive中每张表的数据存储在HDFS

（2）Hive分析数据底层的实现是MapReduce（也可配置为Spark或者Tez）

（3）执行程序运行在Yarn上

2.架构

1）用户接口：Client

CLI（command-line interface）、JDBC/ODBC。

说明：JDBC和ODBC的区别。

（1）JDBC的移植性比ODBC好；（通常情况下，安装完ODBC驱动程序之后，还需要经过确定的配置才能够应用。而不相同的配置在不相同数据库服务器之间不能够通用。所以，安装一次就需要再配置一次。JDBC只需要选取适当的JDBC数据库驱动程序，就不需要额外的配置。在安装过程中，JDBC数据库驱动程序会自己完成有关的配置。）

（2）两者使用的语言不同，JDBC在Java编程时使用，ODBC一般在C/C++编程时使用。

2）元数据：Metastore

元数据包括：数据库（默认是default）、表名、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等。

默认存储在自带的derby数据库中，由于derby数据库只支持单客户端访问，生产环境中为了多人开发，推荐使用MySQL存储Metastore。

3）驱动器：Driver

（1）解析器（SQLParser）：将SQL字符串转换成抽象语法树（AST）

（2）语义分析（Semantic Analyzer）：将AST进一步划分为QeuryBlock

（3）逻辑计划生成器（Logical Plan Gen）：将语法树生成逻辑计划

（4）逻辑优化器（Logical Optimizer）：对逻辑计划进行优化

（5）物理计划生成器（Physical Plan Gen）：根据优化后的逻辑计划生成物理计划

（6）物理优化器（Physical Optimizer）：对物理计划进行优化

（7）执行器（Execution）：执行该计划，得到查询结果并返回给客户端

4）Hadoop

使用HDFS进行存储，可以选择MapReduce/Tez/Spark进行计算。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

joyboysimba CSDN认证博客专家 CSDN认证企业博客

码龄4年

184: 原创

108万+: 周排名

7万+: 总排名

6万+: 访问

: 等级

3137: 积分

944: 粉丝

1294: 获赞

20: 评论

946: 收藏

私信

关注

热门文章

分类专栏

机器学习&深度学习 2篇
LeetCode刷题 135篇
Hadoop 3篇
tensorflow 8篇
项目 1篇
牛客刷题 Java 9篇
Hive 1篇
Azkaban 1篇
Kafka 5篇
随笔 1篇
Flume 3篇
推荐系统 2篇
Java 5篇
数据分析 1篇
强化学习 1篇
zookeeper 2篇
数学建模 3篇

最新评论

【数学建模-层次分析法】
2201_75799418: 选参赛队员那个，A、B矩阵是自己填写的吗？那给出的表格数据有什么用？？？？？？？？？？？？？
linux机器pip报错：ERROR: Could not install packages due to an OSError: [Errno 28] No space left on device
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
力扣双周赛122
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
【windows安装tensorflow-gpu2.4.0】
CSDN-Ada助手: 恭喜您开始博客创作！标题看起来很有吸引力，对于那些想要在Windows上安装tensorflow-gpu2.4.0的人来说，这将是一个非常有用的指南。我期待着阅读您的博客内容，并希望您能够详细介绍安装过程中的每个步骤，以及可能遇到的一些常见问题和解决方法。此外，如果您能提供一些使用tensorflow-gpu2.4.0进行机器学习任务的实例，那将是非常棒的！祝您写作顺利，期待下一篇博客的发布！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
【zookeeper知识点梳理（一）】
CSDN-Ada助手: 这是一篇非常有意思的博文，标题和摘要都很吸引人！你的文章给出了一个有趣的问题，而且开篇就让读者产生了好奇心。我鼓励你继续写作，探索更多关于zookeeper的知识点。在扩展你的知识和技能方面，我想提供一些与zookeeper相关的内容，希望对你有所帮助。除了第一次启动和非第一次启动之外，你可以考虑深入研究zookeeper的数据模型和节点类型，了解zookeeper在分布式系统中的应用场景，以及如何处理节点的增删改查操作。另外，你还可以学习如何使用zookeeper实现分布式锁和选举算法，这些都是zookeeper的常见应用。希望这些建议能对你有所帮助，期待看到你的下一篇博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。