因为之前在ambari中在两台机器上安装了zeppelin,通过hdfs同步配置实现多活,但是当一个notebook过大时,spark卡死的时候,重启容易因为hdfs到本地local的配置同步不一致问题,容易重启失败。
所以,测试环境里通过ambari删除掉一个zeppelin的服务端。
但是再次重启时,出现标题的类似错误。
resource_management.core.exceptions.ExecutionFailed: Execution of 'chown -R zeppelin:zeppelin /var/run/zeppelin' returned 1. chown cannot access '/var/run/zeppelin': No such file or directory
然后查看之前两台机器的该目录,发现没有/var/run/zeppelin目录,创建,并且 sudo chmod 777 /var/run/zeppelin对所有用户的读写执行权限。
再去ambari页面重启就ok了,然后查看目录文件,起始就是个记录PID进程编号的问题,over。