2021SC@SDUSC
资源准备
已经准备好了hive
的源码和社区版IDEA
把他们解压就可以用了
构建hive
我们需要在IDEA
中打开hive
源码并加载好依赖
通过命令行打开IDEA
打开源码的文件夹,然后等着Maven
把依赖都加载完
其实第一次做到这一步的时候,整个虚拟机在加载Maven
的过程中瘫痪了……彻底黑屏,无法再打开。这次没有发生这样的问题,不过还是耗费了大量的时间
ps:仍然有一个依赖是没有找到的,但是不影响debug
远程调试启动配置
我们配置一个远程debug启动
主机名填本主机的名字,端口号填8000(这是hive
debug模式会监听的端口)
启动debug
然后我们启动hive
的debug模式,添加参数--debug
我们可以看到它在监听8000端口,这时我们在IDEA
中启动debug
断点生效了,debug可以运行了。
后记
其实这份虚拟机有一个问题:它的MapReduce
任务提交又出问题了……但是呢,这却正好不影响我们的debug分析。hive
的核心逻辑在于将hql语句转化为MapReduce
,核心在于这个过程而不是hadoop
做的事。这个debug模式还能让我们全面了解到转化过程,可以先用着。