三十七、《大数据项目实战之用户行为分析》Structured Streaming消费Kafka数据实现单词计数

本文介绍了如何使用Spark的Structured Streaming与Kafka集成,实现实时读取Kafka数据并进行单词计数。首先,在Maven项目中导入相关依赖,然后编写StructuredKafkaWordCount.scala程序,从Kafka读取流数据并转换为字符串,通过指定检查点目录确保容错性。最后,程序在IDEA中运行,展示如何累加计算不同批次的单词计数结果。
摘要由CSDN通过智能技术生成

Structured Streaming可以作为消费者与Kafka整合,实时读取Kafka中的数据进行处理。Structured Streaming与Kafka整合,需要Kafka的版本在0.10.0以上。以Kafka为数据源,实现单词计数程序的操作步骤如下:

1. 导入依赖库

在Maven项目的pom.xml中导入以下依赖库:

<!--Spark核心库-->

<dependency>

   <groupId>org.apache.spark</groupId>

   <artifactId>spark-core_2.12</artifactId>

   <version>3.2.1</version>

</dependency>

<!--Spark SQL依赖库-->

<dependency>

   <groupId>org.apache.spark</groupId>

   <artifactId>spark-sql_2.12</artifactId>

   <version>3.2.1</version>

</dependency>

<!-- Structured Streaming针对Kafka的依赖库-->

<dependency>

   <groupId>org.apache.spark</groupId>

   <artifactId>spark-streaming-kafka-0-10_2.12</artifactId>

  
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据张老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值