hive在IDEA中debug

一、hive在IDEA中debug

  1. 安装hadoop环境(1和2替换顺序也可以)

注:hadoop环境不需要从源码编译

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

  1. 按照官网教程编译源码

https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-BuildingHivefromSource

注意事项:maven环境中使用JDK8,否则会出问题

  1. 按照上面2个官网的教程配置好环境,(hive还需要配置mysql,官网没有提)

  2. 开启debug,在$HIVE_HOME/bin下操作:

    • hive-client debug:

      注:在hive-client中debug只可以看到客户端的提交任务的逻辑,看不到sql是如何解析的,sql解析的逻辑需在hive-server中debug

      • 启动hiveserver2:./hiveserver2

      • 启动beeline:beeline -u jdbc:hive2://localhost:10000 --debug

        注:debug不是和beeline绑定的,而是单独的一个脚本文件,hive-server debug也可以使用同样的方式,具体实现细节可以看下bin/hive和bin/ext/debug.sh文件

      • 在idea中配置

        在这里插入图片描述

      • 在配置之后在beeline类中打上断点,点debug按钮即可

        在这里插入图片描述

        在这里插入图片描述

    • hive-server debug:

      • hive-server debug的方式和 hive-client 一样,是在启动hiveServer2的时候开启debug

        ​ hiveserver2 --debug
        在这里插入图片描述

        ​ 在idea中点debug

        在这里插入图片描述

      • 在hiveserver2的debug都通过后,hiveserver2就启动起来了,这时候启动beeline

        ​ beeline -u jdbc:hive2://localhost:10000
        在这里插入图片描述

在这里插入图片描述

二、udf的调用流程(目前只梳理了部分)

  1. hiveserver2在启动的时候会加载udf函数到map里

  2. 生成SQLOperation,封装了输入的sql语句,执行引擎,配置信息。sql:select name, abs(age) from first_test;

在这里插入图片描述

  1. Operation.run()

    1. 生成ast

在这里插入图片描述

  1. 生成执行计划

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值