线上异常问题

最新推荐文章于 2024-09-11 19:58:36 发布

fengfengchen95

最新推荐文章于 2024-09-11 19:58:36 发布

阅读量504

点赞数

分类专栏：异常问题记录

本文链接：https://blog.csdn.net/fengfengchen95/article/details/90172084

版权

异常问题记录专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.kafka连接异常，报错信息如下：

19/05/12 22:44:08 INFO SimpleConsumer: Reconnect due to socket error: java.nio.channels.ClosedChannelException
19/05/12 22:44:08 INFO RecurringTimer: Stopped timer for JobGenerator after time 1557672248000
19/05/12 22:44:08 INFO SimpleConsumer: Reconnect due to socket error: java.nio.channels.ClosedChannelException
19/05/12 22:44:08 ERROR DirectKafkaInputDStream: ArrayBuffer(java.nio.channels.ClosedChannelException, org.apache.spark.SparkException: Couldn't find leader offsets for Set([apply-credit-loan,1]))
19/05/12 22:44:08 INFO SimpleConsumer: Reconnect due to socket error: java.nio.channels.ClosedChannelException

解决办法：因kafka集群不稳定，出现某个broker挂掉的，程序无法读取partion信息。因kafka上设置多副本的模式，即使一个broker挂掉其它也是可以用的。咨询了运维的同事，说是kafka集群不稳定，稍等片刻会自动恢复。而连接异常导致spark程序退出，所以暂时修改spark.streaming.kafka.maxRetries参数，将重试次数调大，待kafka集群自动恢复后，是否能解决此问题。

2.Ambari上启动DataNode节点时报错：