这个错误信息 org.apache.flink.util.FlinkException: The assigned slot container_e04_1714301167548_14301_01_000003_0 was removed
表示 Flink 在尝试分配一个槽(slot)给任务管理器(TaskManager)时,发现该槽已经被移除了。这通常发生在以下几种情况:
-
TaskManager 被终止:当 TaskManager 因为某些原因被 YARN 容器管理系统终止时,它正在使用的槽会被移除。此时,ResourceManager 尝试向已不存在的 TaskManager 分配槽就会触发这个异常。
-
容器完成或失败:YARN 的资源管理器通知 Flink 的 ResourceManager,某个容器已经完成了它的生命周期,或者因为某些原因失败了。ResourceManager 需要处理这些已完成或失败的容器,从而移除它们所占用的槽。
-
资源不足或超时:如果请求的资源长时间无法获得,或者资源不足导致容器被收回,也会导致槽被移除的情况
通过加资源加并行度,解决了