sparkStreaming yarn-cluster消费到了数据但没有处理

最新推荐文章于 2022-03-09 17:51:45 发布

rookie_bigdata

最新推荐文章于 2022-03-09 17:51:45 发布

阅读量167

点赞数

分类专栏： sparkStreaming 文章标签： spark 大数据 yarn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lbg_007/article/details/118091660

版权

sparkStreaming 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文探讨了Spark Streaming作业在YARN-cluster环境下遇到的问题，即在只有一个核心的配置下，仅能消费数据而无法处理。解决办法在于增加executor数量。解决后，作业恢复正常并能同时消费和处理数据。

摘要由CSDN通过智能技术生成

现象：sparkStreaming 作业 local[*] 可以正常消费到数据并处理，但提交到yarn-cluster后只消费到数据但没有处理，从 Streaming Statistics 可见只有消费到数据，但没有处理

原因: 提交命令时只配置了1个 container ，确切的说是1个 core ，该 core 被分配用于消费数据，没有core可以用来处理，通过executor界面可以看到

spark-submit --master yarn-cluster --num-executors 1 --executor-memory 1G

解决：将 --num-executors 1 改为 --num-executors 2

spark-submit --master yarn-cluster --num-executors 2 --executor-memory 1G

正常截图：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sparkStreaming yarn-cluster消费到了数据但没有处理

现象：sparkStreaming 作业 local[*] 可以正常消费到数据并处理，但提交到yarn-cluster后只消费到数据但没有处理，从 Streaming Statistics 可见只有消费到数据，但没有处理原因: 提交命令时只配置了1个 container ，确切的说是1个 core ，该 core 被分配用于消费数据，没有core可以用来处理，通过executor界面可以看到spark-submit --master yarn-cluster --num-executors.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。