Flink-Sql1.12 to Hive使用遇到的问题-程序宕机后重启遇大数据量积压导致taskmanager内存不足无法从指定offset启动

坚持keep

已于 2023-09-15 17:23:15 修改

阅读量129

点赞数

分类专栏： Flink/sql问题文章标签： flink hive 大数据

于 2023-09-15 17:18:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hehe1212tt/article/details/132908224

版权

Flink/sql问题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一. 问题描述：

1. flink在指定kafka offset启动(重启)后，会尝试将从指定offset的数据到最新的数据全部加载至内存并行输出;

2. 若数据量过大，程序报错：Caused by: java.lang.OutOfMemoryError: Java heap space，内存不足，导致无法checkpoints，分区数据文件无法提交，程序最终失败！

二. 处理方案：

1. 数据量太大，flink处理不过来时。任务挂掉之后从最新位置开始读取数据就可以了。会导致丢失任务失败的间隔段。（丢失的数据可以从kafka手动恢复,过程较为麻烦）

2. 将指定的offset调大。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Flink-Sql1.12 to Hive使用遇到的问题-程序宕机后重启遇大数据量积压导致taskmanager内存不足无法从指定offset启动

2. 若数据量过大，程序报错：Caused by: java.lang.OutOfMemoryError: Java heap space，内存不足，导致无法checkpoints，分区数据文件无法提交，程序最终失败！1. 数据量太大，flink处理不过来时。会导致丢失任务失败的间隔段。（丢失的数据可以从kafka手动恢复,过程较为麻烦）1. flink在指定kafka offset启动(重启)后，会尝试将从指定offset的数据到最新的数据全部加载至内存并行输出;2. 将指定的offset调大。
复制链接

扫一扫

专栏目录

坚持keep CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

88万+: 周排名

115万+: 总排名

570: 访问

: 等级

30: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

分类专栏

最新评论

Flink-Sql1.12 to Hive使用遇到的问题-程序宕机后重启遇大数据量积压导致taskmanager内存不足无法从指定offset启动
CSDN-Ada助手: 恭喜您开始博客创作！标题中的问题非常具体，让读者能够一目了然地了解您在Flink-Sql1.12与Hive使用过程中遇到的挑战。希望您能够进一步展开这个问题，并分享您在解决这个问题上的经验和思考。或许您可以讨论如何优化任务管理器内存的配置，以及处理大数据量积压带来的挑战时的不同方法。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Flink-Sql1.12 to Hive使用遇到的问题-程序因集群高负载导致宕机且自动恢复失败原因排查记录
CSDN-Ada助手: 非常棒的博客！你对于Flink-Sql1.12 to Hive使用遇到的问题进行了详细的记录和排查，这对于其他遇到类似问题的人来说非常有帮助。我鼓励你继续分享你的经验和知识，因为你的博客对于社区的贡献是非常宝贵的。除了你在标题和摘要中提到的问题，还有一些与Flink-Sql和Hive相关的扩展知识和技能，可能会对读者有所帮助。例如，了解Flink的流处理和批处理的能力，以及如何在Flink中使用SQL进行数据处理和分析。此外，还可以了解Hive的数据仓库和查询引擎的基本概念和使用方法。希望你能继续分享你的经验和知识，让更多的人受益！同时，也欢迎你在博客中加入更多的扩展知识和技能，让读者能够更全面地了解和应用Flink-Sql1.12 to Hive。谢谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

Flink-Sql1.12 to Hive使用遇到的问题-程序因集群高负载导致宕机且自动恢复失败原因排查记录

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。