KafkaUtils.createDirectStream的个人理解

最新推荐文章于 2024-08-02 02:43:38 发布

钟一鑫

最新推荐文章于 2024-08-02 02:43:38 发布

阅读量1w

点赞数 5

文章标签： kafka spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41083134/article/details/99561175

版权

近几日自己摸索的去看了一下kafka的一些特征，自己总结出来，加深一下印象
这是代码中创建一个对接kafkardd的方法
这个是sparkstreaming对接kafka，用direct方式消费数据的方法，点开这个方法看一下里面的描述
Create an input stream that directly pulls messages from Kafka Brokerswithout using any receiver. This stream can guarantee that each messagefrom Kafka is included in transformations exactly once (see points below)
这是源码里对方法的描述，它说会这个方法会创建一个直接从Kafka代理获取消息的输入流，不使用任何接受器。
下面还有一段对这句话的解释，说这个流会直接查询kafka的偏移量，不使用zk去保存偏移量，消耗跟踪偏移量依靠流自身。还强调了要从程序恢复故障，就要通过StreamingContext启动checkpointing，消耗的偏移量信息可以从checkpoint处恢复。

对于这段话，我有点不理解，忘大佬告知

最低0.47元/天解锁文章

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

钟一鑫 CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

113万+: 周排名

201万+: 总排名

1万+: 访问

: 等级

137: 积分

3: 粉丝

7: 获赞

3: 评论

8: 收藏

私信

关注

热门文章

最新评论

KafkaUtils.createDirectStream的个人理解
钟一鑫回复 weixin_44748137: 谢谢大佬，我再琢磨琢磨
KafkaUtils.createDirectStream的个人理解
weixin_44748137: 对于你不理解的那部分大概就是：该流只确保每一条数据会精确一次的接受以及传输，但是不能保证传输数据的不可重复性（精确一次）有可能你会传两条相同的数据，读过来就是两条不同流，所以需要我们输出的幂等以及输出时的事务。其实也就是会保证读的精确一次但是不能保证输出的精确一次，因为你有可能是有两条相同的数据。
KafkaUtils.createDirectStream的个人理解
枫腾: 大佬牛逼，大佬学到了

最新文章

sparkstreaming对接kafka保存offset到redis

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。