HiveSQL的执行流程

最新推荐文章于 2024-04-27 23:29:59 发布

请学习好嘛

最新推荐文章于 2024-04-27 23:29:59 发布

阅读量1.2k

点赞数 1

文章标签： hive 数据仓库大数据 mapreduce Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45937224/article/details/129462309

版权

hive是基于hadoop的一个数据仓库工具，他将结构化的数据存储在HDFS上，并映射到hive的一张表上，提供类SQL语句对数据进行操作。底层任务调度通过yarn进行资源分配，默认计算引擎为MapReduce，可移植为hive on tez或者hive on spark，下面是一条hive sql的执行流程：

（hive中的四大组件：解析器，编译器，优化器，执行器）

用户通过命令行窗口界面或者别的接口将HQL提交查询

查询的任务被提交到hive，解析器将其解析成抽象为语法树AST，检查语义语法是否正确

HIve服务将抽象语法树转为逻辑执行计划（逻辑查询操作树），描述如何执行查询，包括哪些数据表将被扫描查询，哪些过滤器将被应用，使用哪些聚合函数等等

hive的优化器将逻辑计划进行优化（执行代价估计、查询重写、选择最优执行计划等放法），选择最快资源耗费最少的方式运行

将逻辑计划编译为物理计划（hive一般会对物理计划再次优化），转化为实际的MapReduce任务，这些任务后续将被提交到hadoop集群并进行运行

hive服务器将这物理执行计划提交到yarn，后续被当成一个任务被yarn调度执行

当所有的任务计算完成后，hive服务器将收集对应的任务结果返回给用户。

请学习好嘛

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
HiveSQL的执行流程

HiveSQL的执行流程
复制链接

扫一扫

请学习好嘛

博客等级

码龄4年

18
原创

36
点赞

146
收藏

7
粉丝

关注

私信

热门文章

最新评论

mysql建表语句转为hive建表语句，mysql ddl转为hive ddl
CSDN-Ada助手: 恭喜您写完了第18篇博客！标题看起来很有意思，我相信这篇文章一定会帮助到很多人。您将MySQL建表语句转为Hive建表语句，以及MySQL DDL转为Hive DDL，这是很实用的技能呢。希望您能继续坚持创作，分享更多有关数据库转换的知识。或许可以考虑扩展一下，比如介绍一些在转换过程中可能遇到的常见问题以及解决方案，或者分享一些实际案例，让读者更好地理解如何应用这些转换技巧。再次恭喜您的成果，期待您下一篇博客的发布！
解决vue create 创建项目只有两个文件
套个猴子: 终于解决了
SpringBoot整合hdfs，实现文件上传下载删除与批量删除，以及vue前端发送请求，实现前后端交互功能；
UpFish007: 你好，这个bean的代码能提供一下吗
数据库中DML,DDL,DCL,DQL指的是什么意思
请学习好嘛: 针对与mysql确实数据操作没有select这一说，对于hive的话可能数据操作有时会结和select一起用，避免歧义，我还是给删掉吧
数据库中DML,DDL,DCL,DQL指的是什么意思
Dekazhuo: DML和DQL为啥都有select,反思一下

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。