Kafka介绍
Kafka 是一款性能强大且相当常用的分布式消息队列,常常用于对流量进行消峰、解耦系统和异步处理部分逻辑以提高性能的场景。
在kafka中,所有的消息都以日志的形式存储。这种日志只允许追加新数据,不允许修改之前文件内容
日志文件的存储方式:每个topic有多个partition,每个patition有多个有序日志段
已知offset,如何查找日志
即如何为日志文件建立一个索引,这里很关键的一个问题在于offset是自然线性增长的,是有序的
我们来看一个topic中一个patition的日志文件格式:
00000000000000000000.log //消息体本身日志
00000000000000000000.index //索引
00000000000000000000.timeindex //时间索引