hive sql转换为MapReduce过程

hive sql 转换为 MapReduce过程

  1. antlr 定义sql语法规则,完成sql词法,语法解析,将sql转换为抽象语法树AST tree
  2. 遍历 AST tree,抽象出查询的基本单元 查询块queryBlock
  3. 遍历 queryBlock,翻译成执行操作树 operatorTree
  4. 逻辑层优化器进行OperatorTree优化,合并不需要的reduceSinkOperator(合并操作),减少shuffle(遍历清洗)数据量
  5. 遍历operatorTree ,翻译成MapReduce任务
  6. 物理层优化器进行MapReduce任务的转化,生成最终执行计划

一个复杂的hive sql 可能会转化成 多个 MapReduce任务执行

 

HiveSql->AST tree(抽象语法树)->query block(查询块)->operation tree(执行操作树)->逻辑层优化执行操作树 减少重复的合并 减少不必要的shuffle(混洗)->new operation tree(新的执行逻辑树)->MapReduce task->进行物理层的优化->new MapReduce task

 

转载于:https://my.oschina.net/u/2969788/blog/1622638

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值