从使用 Flink 到至今,遇到的 Flink 有很多,解决的问题更多(含帮助微信好友解决问题),所以对于 Flink 可能遇到的问题及解决办法都比较清楚,那么在这章就给大家讲解下几个 Flink 中比较常遇到的问题的解决办法。
Flink Job 常见重启错误
不知道大家是否有遇到过这样的问题:整个 Job 一直在重启,并且还会伴随着一些错误(可以通过 UI 查看 Exceptions 日志),以下是笔者遇到过的一些问题截图:



其实遇到上面这种问题比较常见的,比如有时候因为数据的问题(不合规范、为 null 等),这时在处理这些脏数据的时候可能就会遇到各种各样的异常错误,比如空指针、数组越界、数据类型转换错误等。可能你会说只要过滤掉这种脏数据就行了,
本文详细介绍了Flink Job的常见重启错误及如何配置RestartStrategy,包括FixedDelayRestartStrategy、FailureRateRestartStrategy、NoRestartStrategy和Fallback策略。讨论了为何需要RestartStrategy以保证Job稳定性,并分析了RestartStrategy的源码。最后提到了Failover Strategies的全任务重启和基于Region的局部故障重启策略。
订阅专栏 解锁全文
581

被折叠的 条评论
为什么被折叠?



