1 运行topology时提示work数量不够。或者没有活着的supervisor,Failed to make assignment xxxx, due to no alive supervisor
但是从集群运行正常,启动supervisor的时候也没有报错。
分析:查看后发现master和supervisor的系统时间不一样,supervisor所在机器的时间比nimbus所在机器的时间早几个小时,导致nimbus任务supervisor节点已经死掉了
解决。修改集群时间不同的机器,使得整个集群使用同一个时间。