了解一下,如何管理kafka的消费的offset
earliest: 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费
latest: 当各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,消费新产生的该分区下的数据
none: topic各分区都存在已提交的offset时,从offset后开始消费;只要有一个分区不存在已提交的offset,则抛出异常
对于offset的设置,目前的我程序是这样一个情况:
1.flink开启了checkpoint,这里会提交offset和topic和partition等信息到checkpoint中
2.消费模式是auto.offset.reset=eraliest
在flink正常运行的情况下,flink启动之后就会一直运行下去,
消费了一些数据并且提交了checkpoint,下一次消费的时候,忽然终止,出现异常等,再次重启时消费的位置是从上一次的checkpoint提交的offset处开始消费。
但是对于我这种初学者还需要写一个程序去手动管理查看offset和partition等信息。这个还在研究中,后续会补充上来。