问题原因
任务运行中,若重启过flink服务,服务启动过程中会修改flink在hdfs上的目录权限及属组。
任务运行时,触发checkpoint时会判断判断该目录owner是否正确,若不属于当前运行用户,会导致任务写checkpoint失败。
1、在异常flink节点/opt/huawei/Bigdata/FusionInsight_Current/_FlinkResource/install/flink/sbin/flink-prestart.sh文件中搜索chmod,(**_根据环境中实际值调整)注释如下两行:
#change ownerand mode
#$hdfsCmd-chmod 777 $flinkDir
#$hdfsCmd-chown "flink:hadoop" $flinkDir
注释后,重启节点服务,待服务启动后,再对注释掉内容取消注释即可