Kafka中消息是以topic进行分类
topic是逻辑上的概念,而partition是物理上的概念
最主要的两个文件
-
log:存放日志数据
-
index:主要作用是如何查找数据
默认存放7天
最大存放数据大小1G
当超过数据默认大小时
log文件的索引00000000000000000000.index 00000000000000000000.log 00000000000000170410.index 00000000000000170410.log 00000000000000239430.index 00000000000000239430.log .index文件名前的数字主要表示当前log下的最小的偏移量 index和log文件以当前segment的第一条消息的offset命名。
通过二分法根据前面0 1 2 3 4等进行查找分析 由于在每一条中的存储数据的大小时固定的,index中只存储偏移量,根据定位到不同的值对log进行查找