kafka broker这部分,可能是kafka系列知识的核心所在。好好总结。
1.消息的存储
1.1 存储文件
在上文曾经介绍过,kafka的消息都是由partition为维度保存的。实际情况下,每个partition正是broker上的一个文件夹,文件夹下保存了segment和index两种文件。
segment文件分为日志文件和索引文件。日志文件后缀名为.log,保存在/${topicName}-${partitionid}/路径下,是实际保存消息的日志文件。每个文件最大不超过1G,超过后将新建文件继续保存。文件名命名规则是64位long大小,19位数字字符长度,不足用0填充,数字是上一个log文件的最后一个offset值+1。
索引文件保存路径与.log文件一致。索引文件的分段逻辑默认和log文件一样,同时也支持单独配置。索引不会针对每条消息都创建,而是当log文件每隔一定的字节数(由log.index.interval.bytes配置,默认4KB)再创建。索引文件可分为偏移量索引(offset index)和时间戳索引(timestamp index)两种。
偏移量索引:后缀名为.index。每条索引占8个字节,包含relativeOffset和position两部分。relativeOffset是相对偏移量占用4个字节,表示消息相对于日志分段文件名的偏移量(relativeOffset = 消息偏移量messageOffset - 消息所在日志分段文件的开始偏移量baseOffset)。position是消息所在具体的日志分段文件的位置,占用4