Kafka踩坑 - Couldn't find leaders for Set

原创 2017年01月03日 15:50:21

SparkStreaming程序从Kafka读数据的程序运行期间报了如下异常:

org.apache.spark.SparkException: ArrayBuffer(org.apache.spark.SparkException: Couldn't find leaders for Set
这个异常意思是Spark找不到partition的Leader。查看监控后发现,在异常发生的时间点,有一个Broker挂掉了。可是对应Topic的replica设置的2,就算挂掉一个,应该有replica顶上啊。后来发现,这是由于存在Partition的Replica没有跟Leader保持同步更新,也就是通常所说的“没追上”。 查看某个Topic是否存在没追上的情况:
kafka-topics.sh --describe --zookeeper XXX --topic XXX

观察其中的Replicas和Isr是否一致,如果出现Isr少于Replicas,则对应Partition存在没追上的情况

解决方法:
增大num.replica.fetchers的值,此参数是Replicas从Leader同步数据的线程数,默认为1,增大此参数即增大了同步IO。经过测试,增大此值后,不再有追不上的情况

确定问题已解决的方法:
启动出现问题的SparkStreaming程序,在程序正常计算的状态下,kill掉任意一个Broker后,再观察运行情况。在增大同步线程数之前,kill后SparkStreaming会报同样的异常,而增大后程序依然正常运行,问题解决。

版权声明:本文为博主原创文章,转载务必注明出处,否则追求法律责任

yarn-cluster运行spark streaming问题

yarn-cluster运行spark streaming问题

Kafka系列2-producer和consumer报错

1. 使用127.0.0.1启动生产和消费进程: 1)启动生产者进程: bin/kafka-console-producer.sh --broker-list 127.0.0.1:9092...
  • kuluzs
  • kuluzs
  • 2016年06月03日 11:39
  • 20741

Kafka#2:消息队列

问题 消息协议 消息订阅 消息存储 消息投递 消息顺序 消息清理 消息优先级 消息过滤 消息堆积 事务消息...

kafka消费者报错:Failed to add leader for partitions

最近遇到过这种错误两次了,通过describe来看的时候是正常的,但是总会报错,猜测试网络问题。果不其然, 一次是一台kafka的机器的防火墙没有关掉,关掉之后就ok了。 另外一次是因为工程把主机...

这几天折腾spark的kafka的低阶API createDirectStream的一些总结。

大家都知道在spark1.3版本后,kafkautil里面提供了两个创建dstream的方法,一个是老版本中有的createStream方法,还有一个是后面新加的createDirectStream方...

Couldn't find leader offsets for Set news_topic

kafka topic must contain at least one message before the DirectStream creation http://apache-sp...

spark用submit提交程序遇到的错误(机器内存较小)

部署使用的spark版本是spark1.3.0部署环境: 主节点centos7操作系统 2g内存   从节点debian系统1g内存(2个) spark-env.sh的设置如下: export SC...

SparkStreaming程序运行报错SparkStreaming-Kafka- Couldn't find leaders for Set

报错信息如下: 查看kafka相关的主题信息: [root@slave10 bin]# kafka-topics --describe --zookeeper 10.2.2...
  • hblfyla
  • hblfyla
  • 2017年09月18日 16:35
  • 159

第114课(Scala版本)SparkStreaming+Kafka+Spark SQL+TopN+Mysql 电商广告点击综合案例实战

114课程 scala 版本开始了 1. 114重写了scala代码 2. 在虚拟机master 下载 安装scalaide 3 导入spark kafka spark streaming的 ja...

Couldn't find leader offsets for Set([smt,0], [smt,1], [smt,2])

Couldn‘t find leader offsets for Set ([luwc_test,0],[luwc_test,1]) 异常问题。 解决方案:要在kafka集群的hosts要配到s...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Kafka踩坑 - Couldn't find leaders for Set
举报原因:
原因补充:

(最多只允许输入30个字)