hive_调优笔记一EXPLAIN解析

接触越多,越需要了解hive背后的理论知识以及底层的一些实现细节,会让用户更加高效地使用Hive

   --摘于HIVE 编程指南.


 ----1

    使用EXPLAIN

    了解Hive是如何工作,第一个就是需要了解EXPLAIN功能

    使用例子:

   

hive >explain select sum(id) from my;
OK
ABSTRACT SYNTAX TREE:
  (TOK_QUERY (TOK_FROM (TOK_TABREF (TOK_TABNAME my)))  (TOK_INSERT (TOK_DESTINATION (TOK_DIR TOK_TMP_FILE)) (TOK_SELECT (TOK_SELEXPR (TOK_FUNCTION sum (TOK_TABLE_OR_COL id))))))


STAGE DEPENDENCIES:
  Stage-1 is a root stage
  Stage-0 is a root stage


STAGE PLANS:
   Stage: Stage-1
    Map Reduce                                                                   --发生在job的map处理阶段过程
      Alias -> Map Operator Tree:
        my 
          TableScan                                                                    --TableScan以my表作为输入
            alias: my
            Select Operator
              expressions:
                    expr: id
                    type: int
              outputColumnNames: id
              Group By Operator
                aggregations:
                      expr: sum(id)                                                     --group by Operator会应用到sum(id)
                bucketGroup: false
                mode: hash
                 outputColumnNames: _col0                                 ----为临时结果字段按规则起的临时字段名
                Reduce Output Operator
                  sort order: 
                  tag: -1
                  value expressions:
                        expr: _col0
                        type: bigint
      Reduce Operator Tree:                                                       --reduce过程 
        Group By Operator
          aggregations:
                expr: sum(VALUE._col0)
          bucketGroup: false
          mode: mergepartial
          outputColumnNames: _col0
          Select Operator
            expressions:
                  expr: _col0
                  type: bigint
            outputColumnNames: _col0
            File Output Operator                                                      --在reducer中科院看到File Output Operator,说明输出结果将是文本格式
              compressed: false
              GlobalTableId: 0
              table:
                  input format: org.apache.hadoop.mapred.TextInputFormat
                  output format: org.apache.hadoop.hive.ql.io. HiveIgnoreKeyTextOutputFormat                       ---说明输出结果将是文本格式,基于字符串的输出格式


  Stage: Stage-0
    Fetch Operator
      limit: -1                                                                --job没有limit ,因此是一个没有操作的阶段

解释:

    1、TOK_INSERT (TOK_DESTINATION (TOK_DIR TOK_TMP_FILE)   说明,虽然查询会将结果输出到控制台,但hive实际上会先将输出写入到一个临时文件。

   2、Stage: Stage-1  一个Hive任务会包含一个或多个stage  


  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值