KafkaUtils.createDirectStream的个人理解

近几日自己摸索的去看了一下kafka的一些特征,自己总结出来,加深一下印象
这是代码中创建一个对接kafkardd的方法
这个是sparkstreaming对接kafka,用direct方式消费数据的方法,点开这个方法看一下里面的描述
Create an input stream that directly pulls messages from Kafka Brokerswithout using any receiver. This stream can guarantee that each messagefrom Kafka is included in transformations exactly once (see points below)
这是源码里对方法的描述,它说会这个方法会创建一个直接从Kafka代理获取消息的输入流,不使用任何接受器。
下面还有一段对这句话的解释,说这个流会直接查询kafka的偏移量,不使用zk去保存偏移量,消耗跟踪偏移量依靠流自身。还强调了要从程序恢复故障,就要通过StreamingContext启动checkpointing,消耗的偏移量信息可以从checkpoint处恢复。


对于这段话,我有点不理解,忘大佬告知

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值