1.一个topic包含多个partition而message存储在partition当中,offset可以看作是message在partition中的id通过它kafka可以定位具体的message。
2.一个partition又是由多个segment(片段)组成,生产者发送消息给topic,broker收到消息后向partition中最后一个segment添加该消息,当segment达到一定大小后broker会创建新的segment。
3. 在server.properties文件中log.dirs=/opt/kafka_data指定了kafka数据的存储目录
图中的hello-0就是topic为hello,partition为0,一个partition一个文件夹。
Partition下会有很多个segment,每个片段文件名以此片段中最小的那个offset命名,分别包含index和log文件,index是索引文件log是数据文件,两个文件同名都是以最小的offset命名的。