sparkStreaming
文章平均质量分 86
sparkStreaming
遥遥晚风点点
大数据,java
展开
-
SparkStreaming直连kafka报错:requirement failed: Failed to get records for spark-executor-xxx topic_xxxx
依次排查后,确认是kafka服务端网络问题,因为sparkStreaming连接kafka走得是公网,数据量大网络不稳定是常有的情况,由于超过spark.streaming.kafka.consumer.poll.ms设置的120s时长,task没获取到对应的topic分区的数据,就会导致类似连接超时的异常,那这个task就fail掉了。:奇了怪了,这个任务之前一直在生产上跑的好好的,突然今天发现大批量的task在pending中,而且每个批次的job执行的时间都超过了窗口时间。原创 2024-07-04 10:28:29 · 533 阅读 · 0 评论 -
Spark Streaming整合kafka
maven依赖<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.12</artifactId> <version>3.0.0</version></dependency><dependency> <groupId>org.apach原创 2020-08-27 23:19:17 · 206 阅读 · 0 评论 -
Spark Streaming入门WordCount案例
maven依赖:<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.12</artifactId> <version>3.0.0</version> </dependency>代码:import org.apache.spark.streaming.dstrea原创 2020-08-27 19:57:55 · 213 阅读 · 0 评论