滴滴二面:kafka 的零拷贝原理?

最近一个朋友去滴滴面试,在第二面的时候遇到了这个问题:
”请你简单说一下 Kafka 的零拷贝原理
然后那个朋友努力在大脑里检索了很久,没有回答上来。
那么今天,我们基于这个问题来看看,高手是如何回答的!

一、问题解析

在实际应用中,如果我们需要把磁盘中的某个文件内容发送到远程服务器上,如图
那么它必须要经过几个拷贝的过程,如图(贴图)。
1. 从磁盘中读取目标文件内容拷贝到内核缓冲区
2. CPU 控制器再把内核缓冲区的数据赋值到用户空间的缓冲区中
3. 接着在应用程序中,调用 write()方法,把用户空间缓冲区中的数据拷贝到内核下
的 Socket Buffer 中。
4. 最后,把在内核模式下的 SocketBuffer 中的数据赋值到网卡缓冲区(NIC Buffer)
5. 网卡缓冲区再把数据传输到目标服务器上。
在这个过程中我们可以发现,数据从磁盘到最终发送出去,要经历 4 次拷贝,而在这四
次拷贝过程中,有两次拷贝是浪费的,分别是:
6. 从内核空间赋值到用户空间
7. 从用户空间再次复制到内核空间
除此之外,由于用户空间和内核空间的切换会带来 CPU 的上线文切换,对于 CPU 性能
也会造成性能影响。
而零拷贝,就是把这两次多于的拷贝省略掉,应用程序可以直接把磁盘中的数据从内核
中直接传输给 Socket,而不需要再经过应用程序所在的用户空间,如下图所示。
所以,所谓零拷贝,并不是完全没有数据赋值,只是相对于用户空间来说,不再需要进
行数据拷贝。对于前面说的整个流程来说,零拷贝只是减少了不必要的拷贝次数而已。
在程序中如何实现零拷贝呢?
在 Linux 中,零拷贝技术依赖于底层的 sendfile()方法实现
在 Java 中,FileChannal.transferTo() 方法的底层实现就是 sendfile() 方法。
除此之外,还有一个 mmap 的文件映射机制
它的原理是:将磁盘文件映射到内存, 用户通过修改内存就能修改磁盘文件。使用这种
方式可以获取很大的 I/O 提升,省去了用户空间到内核空间复制的开销。
以上就是我对于 Kafka 中零拷贝原理的理解

二、问题总结

好的,本期的高手面试系列就到这里结束了。
本次的面试题涉及到一些计算机底层的原理,基本上也是业务程序员的知识盲区。
但我想提醒大家,做开发其实和建房子一样,要想楼层更高更稳,首先地基要打牢固。
另外,如果你有任何面试相关的疑问,欢迎评论区给我留言。
我是 浮生,一个工作了 14 年的 Java 程序员,咱们下期再见。

 

三、粉丝福利

最近很多同学问我有没有java学习资料,我根据我从小白到架构师多年的学习经验整理出来了一份 50W字面试解析文档、简历模板、学习路线图、java必看学习书籍 、 需要的小伙伴 可以关注我的
 
公众号:“ 灰灰聊架构 ”, 回复暗号:“ 321 ”即可获取
———————

  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值