tensorflow 分布式结合hdfs 报错:No lease on File does not exist. Holder DFSClient_NONMAPREDUCE

在尝试使用TensorFlow进行分布式计算并结合HDFS时,遇到了'No lease on File does not exist. Holder DFSClient_NONMAPREDUCE'的错误。问题可能源于多个进程同时读写同一目录。根据分析,该错误可能是由于多个进程试图访问不存在的文件导致的。解决方案是在启动多进程时加入10秒的睡眠时间以避免并发冲突。此外,使用TensorBoard查看日志也需要配置相应的环境。
摘要由CSDN通过智能技术生成
  1. tensorflow 分布式脚本启动方式:
    https://github.com/tensorflow/examples/blob/master/community/en/docs/deploy/hadoop.md

  2. 在分布式程序执行代码中使用multiprocessing 分别启动ps, master, worker

    multiprocessing.Process(target=start_dist, args=(params, ps_index, 'ps', '')).start()
            time.sleep(10.0)  # 添加后解决
    

启动过程中报出错误: at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)
org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException): No lease on /root/Deles/pipeline.config (inode 59875): File does not exist. Holder DFSClient_NONMAPREDUCE_184200389_1 does not have any open files.

  1. 分析:错误可能原因,多个进程读取创建同一个目录导致 :https://www.cnblo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值