1,数据储存
日志和数据存储分离,因为kafka保存数据的文件是以.log为后缀的。为了方便区分,最好在kafka配置文件中指定一下保存数据的路径。另外.log文件存的实际数据默认保存7天,单文件个数最大为1G
2,offset储存
0.9版本以前offset存在zk中,0.9版本以后存在kafka本地
3,
发送完成后将偏移量发送回去
4,
这个图说明kafka不能保证全局有序,只能保证区内有序性
5,kafka采取分片和索引机制
将每个Partition分成多个Segment,每个segment最大为1G默