HIVE的执行流程及UDF

本文介绍了HIVE SQL的执行流程,从SQL解析成抽象语法树,经过逻辑和物理优化生成MapReduce任务。重点探讨了UDF,包括一对一映射的UDF、聚合的UDAF和生成表的UDTF,并提供了自定义UDF的步骤。
摘要由CSDN通过智能技术生成
HIVE SQL的执行流程

SQL ON HADOOP ⇒ Cluster
SQL ⇒ Parser ⇒ AST(抽象语法树) ⇒ Analyzer⇒ QB⇒ Logical Plan⇒ Operator Tree⇒ Logical Optimizer⇒ Operator Tree ⇒ Physical Plan ⇒TaskTree⇒ Physical Optimizer⇒ Task Tree

首先是一个parser(解析),sql解析成抽象语法树,语法树是一个字符串,如:

(TOK_QUERY (TOK_FROM (TOK_TABREF src))  # 起始表
 (TOK_INSERT (TOK_DESTINATION (TOK_TAB dest_g1)) # 目标表 
 (TOK_SELECT (TOK_SELEXPR (TOK_COLREF src key))  #某个字段
 (TOK_SELEXPR (TOK_FUNCTION sum  #函数
 (TOK_FUNCTION substr (TOK_COLREF src value) 4)))) # 
 (TOK_GROUPBY (TOK_COLREF src key))))

遍历AST Tree,抽象出查询的基本组成单元QueryBlock,遍历QueryBlock,生成逻辑执行计划(logical plan),一堆的operator,然后进行Logical Optimizer(逻辑优化),产出还是一堆Operator Tree,之后生成物理执行计划,也就是MapReduce Task,然后进行物理层优化,最后提交运行
更加详细的内容可阅读这篇文章:

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值