hive在IDEA中debug

stable_阿甘

于 2023-01-15 09:23:02 发布

阅读量398

点赞数

分类专栏： hive 文章标签： hive intellij-idea hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/stable_zl/article/details/128691760

版权

hive 专栏收录该内容

13 篇文章 2 订阅

订阅专栏

一、hive在IDEA中debug

安装hadoop环境（1和2替换顺序也可以）

注：hadoop环境不需要从源码编译

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

按照官网教程编译源码

https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-BuildingHivefromSource

注意事项：maven环境中使用JDK8，否则会出问题

按照上面2个官网的教程配置好环境，（hive还需要配置mysql，官网没有提）
开启debug，在$HIVE_HOME/bin下操作：
- hive-client debug：
  
  注：在hive-client中debug只可以看到客户端的提交任务的逻辑，看不到sql是如何解析的，sql解析的逻辑需在hive-server中debug
  - 启动hiveserver2：./hiveserver2
  - 启动beeline：beeline -u jdbc:hive2://localhost:10000 --debug
    
    注：debug不是和beeline绑定的，而是单独的一个脚本文件，hive-server debug也可以使用同样的方式，具体实现细节可以看下bin/hive和bin/ext/debug.sh文件
  - 在idea中配置
  - 在配置之后在beeline类中打上断点，点debug按钮即可
- hive-server debug：
  - hive-server debug的方式和 hive-client 一样，是在启动hiveServer2的时候开启debug
    
    hiveserver2 --debug
    
    在idea中点debug
  - 在hiveserver2的debug都通过后，hiveserver2就启动起来了，这时候启动beeline
    
    beeline -u jdbc:hive2://localhost:10000

在这里插入图片描述

二、udf的调用流程（目前只梳理了部分）

hiveserver2在启动的时候会加载udf函数到map里
生成SQLOperation，封装了输入的sql语句，执行引擎，配置信息。sql：select name, abs(age) from first_test;

在这里插入图片描述

Operation.run()
1. 生成ast

在这里插入图片描述

生成执行计划

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive在IDEA中debug

本文介绍了如何在本地利用idea做hive的debug
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。