SparkStreaming+Kafka 实现基于缓存的实时wordcount程序

董可伦

已于 2023-02-07 15:22:52 修改

阅读量1.7k

点赞数 2

分类专栏： SparkStreaming kafka Spark 文章标签： SparkStreaming kafka spark

于 2018-06-25 09:44:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dkl12/article/details/80797535

版权

Spark 同时被 3 个专栏收录

76 篇文章 8 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

8 篇文章 1 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

本文介绍了如何使用SparkStreaming和Kafka实现基于缓存的实时wordcount程序，通过updateStateByKey算子实现历史数据累加。文章详细讲述了从数据准备、Kafka主题创建、checkpoint目录设定、Spark代码编写到数据生产和最终结果展示的全过程。

摘要由CSDN通过智能技术生成

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站：https://www.captainai.net/dongkelun

前言

本文利用SparkStreaming和Kafka实现基于缓存的实时wordcount程序，什么意思呢，因为一般的SparkStreaming的wordcount程序比如官网上的，只能统计最新时间间隔内的每个单词的数量，而不能将历史的累加起来，本文是看了教程之后，自己实现了一下kafka的程序，记录在这里。其实没什么难度，只是用了一个updateStateByKey算子就能实现，因为第一次用这个算子，所以正好学习一下。

1、数据

数据是我随机在kafka里生产的几条，单词以空格区分开

2、kafka topic

首先在kafka建一个程序用到topic:UpdateStateBykeyWordCount

bin/kafka-topics.sh --create

了解本专栏

超级会员免费看

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

董可伦

CSDN认证博客专家 CSDN认证企业博客

码龄10年

大数据领域优质创作者

163: 原创

7114: 周排名

6826: 总排名

78万+: 访问

: 等级

8325: 积分

2万+: 粉丝

1109: 获赞

1284: 评论

1967: 收藏

私信

关注

热门文章

分类专栏

最新评论

QQ 截图工具独立版安装使用
Ruci_Shenhao: 提示“相关环境初始化失败”是怎么回事呢？
QQ 截图工具独立版安装使用
董可伦: 好吧，我习惯ctrl+alt+a
QQ 截图工具独立版安装使用
YuuuuuCheng: 快捷键设置不能Shift+X
Flink用户自定义连接器（Table API Connectors）学习总结
W.u: 我调接口能获取到，flink 创建表语句也是没问题，但是我在执行select 的时候，他还是这样，用的就是你的建表语句，ip那些我就不贴了。 {"id":1,"name":"wyg"} create table http_get( id int, name string ) flink 的日志报错 Caused by: java.lang.RuntimeException: java.io.IOException: Failed to deserialize JSON '{"id":1,"name":"wyg"}'. at com.dkl.flink.connector.http.HttpSourceFunction.run(HttpSourceFunction.java:70)
Flink用户自定义连接器（Table API Connectors）学习总结
董可伦: 直接用我示例中的建表语句呢？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

董可伦 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。