spring boot 集成spark-streaming-kafka

最新推荐文章于 2024-08-03 14:39:22 发布

river_rock

最新推荐文章于 2024-08-03 14:39:22 发布

阅读量1w

点赞数 1

本文链接：https://blog.csdn.net/swjtu_yhz/article/details/79361472

版权

本文介绍了如何在Spring Boot应用中集成Spark Streaming与Kafka，通过Spring容器管理SparkContext，配置SparkConf，并创建JavaSparkContext。在项目启动后，通过ApplicationStartup监听器启动SparkKafkaStreamExecutor线程，从Kafka消费数据并进行处理。完整代码已分享至GitHub和码云。

摘要由CSDN通过智能技术生成

主要思路：SparkContext由spring容器管理，在spring容器启动完毕后，执行spark-streaming-kafka，获取数据并处理。

1.spring容器中初始化SparkContext，代码片段如下：

@Bean
@ConditionalOnMissingBean(SparkConf.class)
public SparkConf sparkConf() {
SparkConf conf = new SparkConf()
.setAppName(sparkAppName)
.setMaster(sparkMasteer).set("spark.driver.memory",sparkDriverMemory)
.set("spark.worker.memory",sparkWorkerMemory)//"26g".set("spark.shuffle.memoryFraction","0") //默认0.2
.set("spark.executor.memory",sparkExecutorMemory)
.set("spark.rpc.message.maxSize",sparkRpcMessageMaxSize);
// .setMaster("local[*]");//just use in test
return conf;
}
@Bean
@ConditionalOnMissingBean(JavaSparkContext.class) //默认： JVM 只允许存在一个sparkcontext
public JavaSparkContext javaSparkContext(@Autowired SparkConf sparkConf) {
return new JavaSparkContext(sparkConf);