Kafka的零拷贝

最新推荐文章于 2024-07-18 09:40:53 发布

鱼跃鹰飞

最新推荐文章于 2024-07-18 09:40:53 发布

阅读量2.4k

点赞数

分类专栏：大厂真题微服务高频面试题文章标签： kafka 分布式大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chang_Yafei/article/details/132005670

版权

高频面试题同时被 3 个专栏收录

75 篇文章 2 订阅

订阅专栏

23 篇文章 0 订阅

订阅专栏

15 篇文章 0 订阅

订阅专栏

传统的IO模型

如果要把磁盘中的某个文件发送到远程服务器需要经历以下几个步骤

(1) 从磁盘中读取文件的内容，然后拷贝到内核缓冲区

(2) CPU把内核缓冲区的数据赋值到用户空间的缓冲区

(3) 在用户程序中调用write方法，把用户缓冲区的数据拷贝到内核下面的Socket Buffer中

(4) 把内核下面的Socket Buffer中的数据赋值到网卡的缓冲区

(5) 网卡的缓冲区把数据传输到目标服务器上

我们可以看到这个过程中经历了四次拷贝

我们所说的零拷贝并不是没有拷贝（数据赋值），去掉的两次浪费的拷贝分别是

1.从内核空间赋值到用户空间的拷贝

2.从用户空间再次复制到内核空间的拷贝

由于用户空间和内核空间的切换会带来CPU的上下文切换，对于CPU的性能也会造成影响

零拷贝就是把这两次多余的拷贝省略掉，应用程序可以直接把磁盘中的数据从内核中直接传输给Socket,而不再需要经过应用程序所在的用户空间，所以零拷贝不是没有拷贝，而是对于用户空间来说，不再需要进行数据拷贝，这只是较少了不必要的拷贝次数而已

零拷贝的原理

在程序中实现零拷贝的方式：

1. 在Linux中，零拷贝技术依赖于底层的sendfile方法实现

2. 在Java中，FileChannel.transferTo()方法的底层调用就是sendfile方法

3. MMAP文件映射机制

mmap（即 memory-mapped file）是一种内存映射文件的机制，它可以让程序将一个文件映射到进程的地址空间，从而实现文件和内存的无缝转换。

具体来说，使用mmap将一个文件映射到进程的地址空间后，该文件就可以像普通的内存一样被读写，甚至可以在多个进程之间共享，而不需要进行繁琐的文件读写操作。在使用mmap时，操作系统会自动将文件的某些部分或者整个文件的内容映射到内存中，而这些映射的内存区域可以被当作普通的内存指针来访问，从而实现对文件内容的访问。

mmap的一些主要应用场景包括：

实现零拷贝（zero-copy）网络传输：可以将网络数据直接映射到进程的地址空间，避免了数据拷贝的开销。
实现高性能的数据库和搜索引擎：将大规模的数据文件映射到内存中，可以大大提升数据的访问速度。
实现内存共享和进程间通信：多个进程可以映射同一个文件到它们各自的地址空间，从而实现进程间共享数据的目的。
————————————————
版权声明：本文为CSDN博主「鱼跃鹰飞」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/Chang_Yafei/article/details/129505855

Kafka采用sendfile的方式去完成拷贝的过程

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Kafka的零拷贝

在使用mmap时，操作系统会自动将文件的某些部分或者整个文件的内容映射到内存中，而这些映射的内存区域可以被当作普通的内存指针来访问，从而实现对文件内容的访问。零拷贝就是把这两次多余的拷贝省略掉，应用程序可以直接把磁盘中的数据从内核中直接传输给Socket,而不再需要经过应用程序所在的用户空间，所以零拷贝不是没有拷贝，而是对于用户空间来说，不再需要进行数据拷贝，这只是较少了不必要的拷贝次数而已。实现高性能的数据库和搜索引擎：将大规模的数据文件映射到内存中，可以大大提升数据的访问速度。
复制链接

扫一扫

专栏目录

鱼跃鹰飞 CSDN认证博客专家 CSDN认证企业博客

码龄3年

157: 原创

105万+: 周排名

4万+: 总排名

9万+: 访问

: 等级

1672: 积分

36: 粉丝

96: 获赞

6: 评论

217: 收藏

私信

关注

热门文章

分类专栏

并发编程 1篇
源码系列 1篇
高频面试题 75篇
Leetcode 29篇
数据结构与算法 46篇
高并发 1篇
大厂真题 23篇
架构设计 5篇
MySQL 11篇
分布式 3篇
微服务 15篇
架构师 9篇
JVM调优 3篇
大数据 1篇
Redis 3篇
微服务踩坑 10篇
Spring 5篇
网络 1篇
Linux 1篇

最新评论

垃圾回收中的分代年龄
yid2022: 分代年龄越小，晋升到老年代的对象越少，因此老年代中的对象数量相对较少，GC 耗时也就会相对较短，他是每次进入到老年代的少了，但是这不是导致他的major越多甚至full gc越多吗，有些7次minor gc就能清理的，现在全要等major gc吗
垃圾回收中的分代年龄
敲键盘的小夜猫: 非常感谢分享！此篇博客深度剖析了主题，逻辑严谨，让读者一直保持感兴趣。语言清晰，例子贴切，使得复杂的概念变得易于理解。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Leetcode高频题：213打家劫舍II
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
接口调用成功却一直返回404
qq_15532291: 你的回答很准确!有用!
Dubbo启动错误
白话机器学习: CSDN付费资源变现玩法，主页详解

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。