hive sql源码解析

最新推荐文章于 2022-09-30 10:33:18 发布

yd_csdn_hadoop_spark

最新推荐文章于 2022-09-30 10:33:18 发布

阅读量1.3k

点赞数 1

分类专栏： hvie 文章标签： mapreduce hive big data

本文链接：https://blog.csdn.net/yd_csdn_asp_net/article/details/121456796

版权

Hivesql ->mapreduce 简单的可以分为六个阶段：

1、SQL词法，语法解析生成抽象语法树AST Tree Antrl定义了SQL语法规则，完成SQL词法、语法解析，将SQL转化为抽象语法树AST Tree，树上的每个节点就是一个ASTNode；

2、遍历AST Tree，抽象出查询的基本组成单元QueryBlock QueryBlock就是一个子查询

Select * from (select * from b) a;

QueryBlock1:select * from b;

QueryBlock2:select * from a;

3、遍历QueryBlock，翻译成执行操作树OperatorTree

4、逻辑层优化器进行OperatorTree变化，合并不必要的ReduceSinkOperator，减少shuffle数据量

5、遍历OperatorTree&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yd_csdn_hadoop_spark

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数仓工具—Hive源码之SQL解析Antlr入门(7)

08-27

4万+

ANTLR 是 ANother Tool for Language Recognition的首字母，是一个语言类工具，主要充当翻译器、编译器、识别器、或者是分析器这样的一个角色，也就是将一些列规则翻译成特定语言代码(Java, C/C++, C#, Python, Ruby)的一个工具。说直白点就是定义语法规则文件—>生成特定语言解析规则文件的代码—>被特定的语言所识别，想想我们的Hive-Sql 是不是就是这样的，不然SQL怎么转化成MR程序。Antlr (ANother Tool for Langua

数仓工具—Hive源码之SQL 解析(6)

热门推荐

08-24

4万+

从上述整个SQL编译的过程，可以看出编译过程的设计有几个优点值得学习和借鉴使用Antlr开源软件定义语法规则，大大简化了词法和语法的编译解析过程，仅仅需要维护一份语法文件即可。整体思路很清晰，分阶段的设计使整个编译过程代码容易维护，使得后续各种优化器方便的以可插拔的方式开关，譬如Hive 0.13最新的特性Vectorization和对Tez引擎的支持都是可插拔的。每个Operator只完成单一的功能，简化了整个MapReduce程序。

参与评论您还未登录，请先登录后发表或查看评论

Hive SQL源码解析

mm_ren的博客

08-28

644

Hive执行SQL的主要流程流程词法、语法解析: Antlr定义SQL的语法规则，完成SQL词法，语法解析，将SQL转化为抽象语法树AST Tree语义解析: 遍历AST Tree，抽象出...

hive工作原理之SQL源码解析

dianfuwo9488的博客

11-23

291

hive自带的sql查询最终是转化成mapreduce任务进行。如何转换的呢？分为如下几步： 1、antlr词法解析器解析SQL成Abstract Syntax Tree即AST树 2、基于AST树解析成若干query block即QB，QB和QBParseInfo其实是hive源码里面的Bean，是SQL解析的关键类下边是QB的关键几个成员如下： public c...

hive sql解析

08-15

hivesql解析支持版本 2.0.1 2.7.2

hive的sql解析

duguduchong的专栏

03-08

3166

写了一个下午，实现了表级别的sql解析。但后来知道taobao那边已经有了完备的字段级别的sql解析工具，所以也就没必要在写下去了。不过还是要将表级别的sql解析介绍介绍，毕竟也写了几百行代码。先把最后的解析结果贴出来： hive> ?select * from sunwg; 0 TOK_QUERY sunwg QueryFromClause Time taken: 0.0010 sec

数仓工具—Hive源码之SQL解析AntlrWorks的使用(10)

09-30

4万+

AntlrWorks 就是Antlr的一个idea ，提供了开发(editor)，测试(interpreter)，调试(debugger)，以及代码生成的功能，其中调试是idea 的Antlr插件不具备的。到今天我们的工具就介绍完了，后面我们就可以专心的学习Antlr以及SQL解析了。

Hive源码分析一

Xlucas的博客

12-23

3294

问题： 1、hive的入口程序 2、hive的local化 3、hivesql执行过程 4、hive的解析和鉴权—下节一：hive的入口程序 1、从 cli.sh文件我们可以看到，调用了类CliDriver进行初始化操作 CLASS=org.apache.hadoop.hive.cli.CliDriver execHiveCmd $CLASS "$@"2、查看 CliDri

Hive SQL的编译过程

美团技术团队

02-12

2793

Hive是基于Hadoop的一个数据仓库系统，在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建，每天执行近万次的Hive ETL计算流程，负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中，我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力，在解决这些问题的同时我们对Hive将SQL编译为MapReduc...

hive中sql解析出对应表和字段的实现

weixin_30732487的博客

06-23

618

import java.io.IOException; import java.util.HashMap; import java.util.HashSet; import java.util.Map; import java.util.Set; import java.util.Stack; import java.util.TreeMap; import org.apac...

hive源码分析

05-25

hive 源码分析

0001-1-HiveSql(解释,编译,优化,执行)源码

我的祖传代码

09-04

626

一架构图 1.1 官网架构图 Driver组件：该组件包括Parser、Compiler、Optimizer和Executor，它的作用是将hivesql进行解析、编译、优化，生成执行计划，然后调用底层的mapreduce计算框架。解释器（Parser）：将SQL转化为抽象语法树AST；编译器（Compiler）：将AST编译成逻辑执行计划；优化器（Optimizer）：对逻辑执行计划进行优化；执行器（Executor）：将逻辑执行计划转成可执行的物理计划; 1.2..

Hive的SQL编译源码详解

好学若饥，谦卑若愚

07-06

2917

看图完事：

HIVE的SQL解析执行

Kun Wang's 博客

07-26

2189

参见： https://www.cnblogs.com/yaojingang/p/5446310.html

Hive SQL执行全过程源码解析(Hive3.1)

Deegue

12-23

8316

Hive任务提交源码解析

Hive3.1.2源码阅读--SQL的解析、编译、优化（二）

Cxf2018的博客

03-26

2629

从前文中可以看到runInternal调用了compile方法，在compile方法我们可以看到执行了以下步骤： 1.1 首先通过ParseUtils.parse将sql解析为抽象的语法树ASTNode 1.2 然后通过sem.analyze(tree, ctx);对解析出来的抽象语法树进行编译和优化我们先进入ParseUtils.parse中进行查看 /** Parses the Hive query. */ public static ASTNode parse(String command.

HiveSQL解析过程详解

Dancy_DD0421的博客

08-09

1805

HiveSQL解析过程详解 Hive是基于Hadoop的一个数据仓库系统，在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建，每天执行近万次的Hive ETL计算流程，负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。在几次升级Hive的过程中，我们遇到了一些大大小小的问题。通过向社区的咨询和自己的努力，在解决这些问题的同时我们对Hive将SQL编译为MapReduce的过程有了比较深入的理解。对这一过程的理解不仅帮助我们解决了一些Hive的bug，也有利于我们优

HiveSQL源码之语法词法编译文件解析一文详解

master_hunter的博客

08-22

2744

工欲善其事必先利其器，首先要了解HiveSQL的编译语法的流程，还是需要懂得HiveSQL的执行流程以及编译规则。Hive详解以及CentOS下部署Hive和Mysql我们现在主要研究SQL Parser语法解析这块内容。语法解析可以说是研究一门编程语言的基础了，我们编程语言本身就是告诉计算机要帮助我们做什么事。antlr是编译原理领域比较著名的工具了,这次借助研究hivesql的机会，安装使用一下antlr。

Apache Hive Cookbook源码解析与实践指南

在这个场景中，"Apache Hive Cookbook_Code 源码"可能是包含了一系列示例代码的代码库，旨在帮助用户了解如何使用Hive进行数据处理和分析。由于没有具体的代码提供，以下基于知识点的解释将重点放在Apache Hive...