hive架构简介

白日梦想东

已于 2022-04-26 14:27:57 修改

阅读量211

点赞数

分类专栏： # Hive 文章标签：数据仓库 etl

于 2022-04-26 14:21:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42282445/article/details/124426896

版权

Hive 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Hive架构

Hive架构图

在这里插入图片描述

1）用户接口：Client

CLI（command-line interface）、JDBC/ODBC(jdbc访问hive)、WEBUI（浏览器访问hive）

2）元数据：Metastore

元数据包括：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、表的类型（是否是外部表）、表的数据所在目录等；
默认存储在自带的derby数据库中，推荐使用MySQL存储Metastore

原因在于Hive默认使用的元数据库为derby，开启Hive之后就会占用元数据库，且不与其他客户端共享数据，如果想多窗口操作就会报错，操作比较局限。以我们需要将Hive的元数据地址改为MySQL，可支持多窗口操作。

3）Hadoop

使用HDFS进行存储，使用MapReduce进行计算。

4）驱动器：Driver

（1）解析器（SQL Parser）：

将SQL字符串转换成抽象语法树AST，这一步一般都用第三方工具库完成，比如antlr；对AST进行语法分析，比如表是否存在、字段是否存在、SQL语义是否有误。

（2）编译器（Physical Plan）：

将AST编译生成逻辑执行计划。

（3）优化器（Query Optimizer）：

对逻辑执行计划进行优化。

（4）执行器（Execution）：

把逻辑执行计划转换成可以运行的物理计划。对于Hive来说，就是MR/Spark。
执行计划转换成可以运行的物理计划。对于Hive来说，就是MR/Spark。

白日梦想东

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

白日梦想东 CSDN认证博客专家 CSDN认证企业博客

码龄6年

27: 原创

107万+: 周排名

74万+: 总排名

2万+: 访问

: 等级

293: 积分

6: 粉丝

6: 获赞

4: 评论

34: 收藏

私信

关注

热门文章

分类专栏

最新评论

【HDFS】二.HDFS的Shell操作
CSDN-Ada助手: 非常棒的博客！我们期待看到更多有关HDFS的博客。如果您正在寻找下一个主题，我们建议您撰写一篇有关MapReduce的博客，从而进一步探究Hadoop生态系统的完整功能。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
一.HIVE调优的多样性
CSDN-Ada助手: 亲爱的博主，感谢您的分享！看到您深入研究了HIVE调优的多样性，让我对此更加了解了。作为读者，我深感受益匪浅。感谢您花费了时间和精力创作这样一篇有价值的文章。接下来，我期待您为我们带来一篇关于“Hadoop生态圈其他组件的最佳实践”的博客。在这个快速变化的技术世界中，只有不断地学习和分享，才能不断进步。期待您的新作品！
Idea不可映射字符问题
shizheng163: 整挺好
Kafka概述
Williamsgogogo: 大佬厉害啊！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。