Spark-streaming-kafka

最新推荐文章于 2024-08-16 09:21:03 发布

非ban必选

最新推荐文章于 2024-08-16 09:21:03 发布

阅读量1.1k

点赞数

分类专栏： Kafka 文章标签： spark-streaming-kakfa

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zsj777/article/details/80311466

版权

本文详细介绍了在使用Spark Streaming与Kafka整合时遇到的问题及解决方案，如fetch.size过大、大量未消费消息处理。并深入讨论了Spark作业的关键参数，包括num-executors、executor-memory、executor-cores、driver-memory、spark.default.parallelism、spark.storage.memoryFraction和spark.shuffle.memoryFraction的含义和调优建议，以帮助提升Spark作业的性能和资源利用率。

摘要由CSDN通过智能技术生成

最近在用spark-streaming-kafka遇到的问题

问题1

There are some messages whose size is larger than the fetch size 1048576 and hence cannot be ever returned. Increase the fetch size, or decrease the maximum message size the broker will allow.

解决方案

修改ConsumerConfig.MAX_PARTITION_FETCH_BYTES_CONFIG(fetch.message.max.bytes)设置个较大的值。

问题2

问题描述：当kafka中存在大量未消费的消息时

当我们提交spark-streaming程序消费kafka中的消息时，若kafka中存在大量未消费的消息，首个batch要处理大量的消息，会导致spark-submit设置的资源无法满足大量消息的处理而导致崩溃。因此在spark-submit启动的时候多加了一个配置:--conf spark.streaming.kafka.maxRatePerPartition=10000。限制每秒钟从topic的每个partition最多消费的消息条数，这样就把首个batch的大量的消息拆分到多个batch中去了，为了更快的消化掉delay的消息，可以调大计算资源和把这个参数调大。

spark executor

Executor是spark任务（task）的执行单元，运行在worker上，但是不等同于worker，实际上它是一组计算资源(cpu核心、memory)的集合。一个worker上的memory、cpu由多个executor共同分摊。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

非ban必选

CSDN认证博客专家 CSDN认证企业博客

码龄14年

523: 原创

9255: 周排名

2645: 总排名

103万+: 访问

: 等级

1万+: 积分

1296: 粉丝

509: 获赞

157: 评论

890: 收藏

私信

关注

热门文章

分类专栏

JavaCV 1篇
C 11篇
docker 34篇
im 29篇
Maven 5篇
mybatis-plus 12篇
netty 52篇
MQTT 8篇
java深度学习 10篇
自动化测试 1篇
TCP/IP 6篇
idea插件 1篇
ES 17篇
海康摄像头 7篇
RS485 3篇
python3 3篇
CDH 31篇
Redis 17篇
Nginx 33篇
Mysql 14篇
Kafka 2篇
Java和Jvm 123篇
Java多线程 23篇
运维测试 25篇
SpringBoot 83篇
SpringCloud 23篇
程序人生 5篇

最新评论

JVM之jstat命令
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
Nginx配置HTTPS访问socket.io server
Hope啦啦啦哈_: 可以看看完整配置吗？比如9000端口的
socket.io客户端java
CSDN-Ada助手: Java 中的面向对象编程的特点是什么？它与函数式编程的区别和联系是什么？
mybatis-plus or查询
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)增加条理清晰的目录；(3)使用更多的站内链接。
关于海康客流统计实时和统计
yyxxxzzz: byMode 怎么修改啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

非ban必选 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。