背景
Zookeeper服务正常运行期间,随机断电后,重启设备后,概率性的无法启动zookeeper服务,启动日志报错
Unable to load database on disk The current epoch, *, is older than the last zxid,
原因分析
Zookeeper的ZAB协议实现里,数据持久化会保存acceptedEpoch、currentEpoch和snapshot.x三种重要文件。acceptedEpoch和 currentEpoch文件是记录当前选举周期值,同时快照文件里zxid也保存着当前周期值,其中currentEpoch和最新的snapshot.x要保持一致。
按照ZAB一致性协议,其认为持久化动作是原子性的,原子操作持久化失败或者成功都不影响数据一致性。但实际实现是无法确保持久化动作原子性,会出现部分持久化成功的情况,导致本地数据异常, zookeeper就会启动失败。
该问题本质是,currentEpoch与最新的s