log文件分析
log文件组成
在我们搭建Kafka集群的时候,一般都会配置日志文件的路径,我们可以通过该路径找到kafka的日志文件,log文件与partition关系如下图所示:Kafka的日志文件可以可以说由对个segment file组成,一个segment file由一个xx…x.log数据文件和一个xx…x.index文件组成,当单个数据文件达到1GB(默认),就会生成新的segment file,所以,一个分区当数据量达到一定时,一个分区就会有多个segment file。数据文件就是kafka缓存下来的数据,默认7天会自动清理。
索引文件和数据文件命名分析
segment file的index文件和log文件都是以log文件第一条消息的偏移量来命名的,长度为20位,不够的在前面补0,在文件达1GB后,新的文件产生,也会是采用这个命名方式,如下图,可以看出第一条数据文件里面有77893条消息,第二个数据文件的第一条数据的偏移量是77894。