上一篇文章介绍了mr和yarn执行过程。我们提交job都是在本地编写代码然后打包传送到linux上然后执行jar。非常麻烦而且不利于调试。所以这篇文章给大家带来如何在本地利用远端环境来调试mr程序。
输入输出路径皆为本地路径:
直接将之前的代码运行会出现以下错误:
没有HADOOP_HOME。。。既然如此那就在本地配置一个。第一次修改:
hadoop包在本地解压配置环境变量(略过)再次执行错误没有消失。。只能手动在代码中设置看看生效没:
出现新的错误:
很难受。。。看到名字就知道缺少windows下的工具包。
下载后放到bin目录下(BD上面一查就有地方下载了)再次执行:
刚才下载的包中还有hadoop.dll文件没用。复制之后放到bin目录和C:\Windows\System32目录下。
历经千辛万苦终于成功:
查看路径:
这下就可以尽情DEBUG加断点的调试mapreduce程序了。
本人QQ/Wechat:806751350
gitbug地址:https://github.com/linminlm