ubmit dinkyTask failed:“java.lang.RuntimeException:

最新推荐文章于 2024-05-03 06:14:22 发布

陈吉俊

最新推荐文章于 2024-05-03 06:14:22 发布

阅读量915

点赞数 6

文章标签： python

本文链接：https://blog.csdn.net/smile6868/article/details/137765713

版权

本文描述了在使用ApacheDolphinScheduler时，遇到的Kubernetes任务提交超时问题，涉及FlinkDeployment的等待超时异常。文章提供了故障排查和优化建议，包括检查集群状态、Flink部署配置和优化作业启动时间等。

摘要由CSDN通过智能技术生成

Caused by: org.apache.dolphinscheduler.plugin.task.api.TaskException: Submit dinkyTask failed:"java.lang.RuntimeException: io.fabric8.kubernetes.client.KubernetesClientTimeoutException: Timed out waiting for [120000] milliseconds for [FlinkDeployment] with name:[ods-erp-pro-df-1] in namespace [dc-dev].\n\tat io.fabric8.kubernetes.client.dsl.base.BaseOperation.waitUntilCondition(BaseOperation.java:858)\n\tat io.fabric8.kubernetes.client.dsl.base.BaseOperation.waitUntilCondition(BaseOperation.java:83)\n\tat io.fabric8.kubernetes.client.dsl.internal.NamespaceVisitFromServerGetWatchDeleteRecreateWaitApplicableImpl.waitUntilCondition(NamespaceVisitFromServerGetWatchDeleteRecreateWaitApplicableImpl.java:220)\n\tat io.fabric8.kubernetes.client.dsl.internal.NamespaceVisitFromServerGetWatchDeleteRecreateWaitApplicableImpl.waitUntilCondition(NamespaceVisitFromServerGetWatchDeleteRecreateWaitApplicableImpl.java:63)\n\tat org.dinky.gateway.kubernetes.operator.KubetnetsApplicationOperatorGateway.submitJar(KubetnetsApplicationOperatorGateway.java:80)\n\tat org.dinky.job.builder.JobTransBuilder.submitByGateway(JobTransBuilder.java:193)\n\tat

从您提供的错误日志来看，这是一个在使用Apache DolphinScheduler（一款分布式工作流任务调度平台）时遇到的问题。具体来说，错误发生在尝试在Kubernetes集群中提交一个名为dinkyTask的任务时。这个任务似乎是一个Flink作业，因为它提到了一个FlinkDeployment资源，名为ods-erp-pro-df-1，位于dc-dev命名空间中。

错误的根本原因是java.lang.RuntimeException，它是由io.fabric8.kubernetes.client.KubernetesClientTimeoutException引起的。这个超时异常表明在等待Kubernetes集群中的FlinkDeployment资源达到某个条件时，操作超出了指定的时间限制（120000毫秒，即120秒）。

以下是对错误日志的逐行分析：

Caused by: org.apache.dolphinscheduler.plugin.task.api.TaskException: Submit dinkyTask failed: 这一行表明DolphinScheduler在尝试提交名为dinkyTask的任务时遇到了问题。
java.lang.RuntimeException: io.fabric8.kubernetes.client.KubernetesClientTimeoutException: Timed out waiting for [120000] milliseconds for [FlinkDeployment] with name:[ods-erp-pro-df-1] in namespace [dc-dev].: 这一行是异常的核心信息，指出了一个运行时异常，具体是由fabric8 Kubernetes客户端的超时异常引起的。它在等待FlinkDeployment资源ods-erp-pro-df-1在dc-dev命名空间中达到某个条件，但等待时间超过了120000毫秒。
接下来的几行是异常堆栈跟踪，它们指出了异常发生的代码位置和调用栈。这些信息对于开发人员来说是有用的，因为它们可以帮助定位问题发生的确切位置。

为了解决这个问题，您可以尝试以下步骤：

检查Kubernetes集群状态：确保Kubernetes集群正常运行，没有资源不足或其他问题。
检查FlinkDeployment配置：确保FlinkDeployment的配置正确无误，包括资源请求、环境变量、依赖服务等。
增加超时时间：如果集群和应用配置都没有问题，但作业启动确实需要更长时间，您可以考虑增加超时时间。
查看Kubernetes事件和日志：通过查看相关Pod的事件和日志，可以获取更多关于为什么FlinkDeployment没有在规定时间内达到预期状态的信息。
优化Flink作业启动时间：如果可能，尝试优化您的Flink作业，使其能够更快地启动和初始化。

希望这些信息对您有所帮助。如果您需要进一步的帮助，请提供更多的上下文信息，以便更准确地诊断和解决问题