linkis-1.0.0部署到hdp集群,执行spark任务时候报错如下:
找到日志linkis-cg-linkismanager.log可以看到一些错误日志,如图所示:
于是开启linkis-cg-linkismanager服务的远程debug,跟踪到源码,当用linkis-cli提交spark任务时候,debug会执行到com.webank.wedatasphere.linkis.resourcemanager.external.yarn类里面的requestResourceInfo()方法,发现其中的rmWebAddress变量值有些蹊跷,如图:
这个值应该是hadoop yarn的rm web地址,但是我环境的rm web地址不是127.0.0.1,所以猜测该错误是在访问rm web时地址不对造成的,继续分析,发现这个地址来源于db中的表linkis_cg_rm_external_resource_provider,它的内容如下:
其中的rm web地址正是debug时候显示的本地”127.0.0.1“,于是修改这个值为实际地址,然后重新提交spark任务即可。