Kafka的特性之一就是高吞吐率,但是Kafka的消息是保存或者存储在磁盘上的。Kafka可以轻松支持每秒百万级的写入请求。为了优化写入速度Kakfa采用了两个技术顺序写入和MMFile
顺序写入和MMFile
顺序写入能提高写入速度,但是也不能和内存进行比对,因此kafka的数据并不是实时的写入硬盘中
MMFile
(Memory Map Filed)内存映射文件。原理是利用操作系统的Page实现文件到物理内存的直接映射。完成了MMF映射后,用户对内存的所有操作会被操作系统自动的刷新到磁盘上,极大地降低了IO使用率。
场景:
1.如果应用A写入pageCache,然后应用A挂掉,但是最终数据还是会写入磁盘中,因为这部分工作是由操作系统决定何时去刷新的
2.应用A写入PageCache,然后应用A挂断,如果服务器不稳定,也会导致pageCache的数据不能刷新到磁盘中,会导致丢失数据,思考,如果保证不丢失?
ZeroCopy
Kafka服务器在相应客户端读取的时候,底层使用ZeroCopy技术,直接将磁盘无需拷贝到用户控件,而是直接将数据通过内核控件传递输出,数据没有抵达用户空间
IO常规