什么是Zero-Copy?

欢迎跳转到本文的原文链接:https://honeypps.com/backend/what-is-zero-copy/

概述

考虑这样一种常用的情形:你需要将静态内容(类似图片、文件)展示给用户。那么这个情形就意味着你需要先将静态内容从磁盘中拷贝出来放到一个内存buf中,然后将这个buf通过socket传输给用户,进而用户或者静态内容的展示。这看起来再正常不过了,但是实际上这是很低效的流程,我们把上面的这种情形抽象成下面的过程:

read(file, tmp_buf, len);
write(socket, tmp_buf, len);

首先调用read将静态内容,这里假设为文件A,读取到tmp_buf, 然后调用write将tmp_buf写入到socket中,如图:

[图片]
在这个过程中文件A的经历了4次copy的过程:

  1. 首先,调用read时,文件A拷贝到了kernel模式;
  2. 之后,CPU控制将kernel模式数据copy到user模式下;
  3. 调用write时,先将user模式下的内容copy到kernel模式下的socket的buffer中;
  4. 最后将kernel模式下的socket buffer的数据copy到网卡设备中传送;

从上面的过程可以看出,数据白白从kernel模式到user模式走了一圈,浪费了2次copy(第一次,从kernel模式拷贝到user模式;第二次从user模式再拷贝回kernel模式,即上面4次过程的第2和3步骤。)。而且上面的过程中kernel和user模式的上下文的切换也是4次。

幸运的是,你可以用一种叫做Zero-Copy的技术来去掉这些无谓的copy。应用程序用Zero-Copy来请求kernel直接把disk的data传输给socket,而不是通过应用程序传输。Zero-Copy大大提高了应用程序的性能,并且减少了kernel和user模式上下文的切换。


详述

Zero-Copy技术省去了将操作系统的read buffer拷贝到程序的buffer,以及从程序buffer拷贝到socket buffer的步骤,直接将read buffer拷贝到socket buffer. Java NIO中的FileChannal.transferTo()方法就是这样的实现,这个实现是依赖于操作系统底层的sendFile()实现的。

public void transferTo(long position, long count, WritableByteChannel target);

他底层的调用时系统调用**sendFile()**方法:

#include <sys/socket.h>
ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

下图展示了在transferTo()之后的数据流向:
[图片]

下图展示了在使用transferTo()之后的上下文切换:
[图片]

使用了Zero-Copy技术之后,整个过程如下:

  1. transferTo()方法使得文件A的内容直接拷贝到一个read buffer(kernel buffer)中;
  2. 然后数据(kernel buffer)拷贝到socket buffer中。
  3. 最后将socket buffer中的数据拷贝到网卡设备(protocol engine)中传输;
    这显然是一个伟大的进步:这里把上下文的切换次数从4次减少到2次,同时也把数据copy的次数从4次降低到了3次。

但是这是Zero-Copy么,答案是否定的。


进阶

Linux 2.1内核开始引入了sendfile函数(上一节有提到),用于将文件通过socket传送。

sendfile(socket, file, len);

该函数通过一次系统调用完成了文件的传送,减少了原来read/write方式的模式切换。此外更是减少了数据的copy, sendfile的详细过程如图:
[图片]
通过sendfile传送文件只需要一次系统调用,当调用sendfile时:

  1. 首先(通过DMA)将数据从磁盘读取到kernel buffer中;
  2. 然后将kernel buffer拷贝到socket buffer中;
  3. 最后将socket buffer中的数据copy到网卡设备(protocol engine)中发送;

这个过程就是第二节(详述)中的那个步骤。

sendfiel与read/write模式相比,少了一次copy。但是从上述过程中也可以发现从kernel buffer中将数据copy到socket buffer是没有必要的。

Linux2.4 内核对sendfile做了改进,如图:
[图片]

改进后的处理过程如下:

  1. 将文件拷贝到kernel buffer中;
  2. 向socket buffer中追加当前要发生的数据在kernel buffer中的位置和偏移量;
  3. 根据socket buffer中的位置和偏移量直接将kernel buffer的数据copy到网卡设备(protocol engine)中;

经过上述过程,数据只经过了2次copy就从磁盘传送出去了。
这个才是真正的Zero-Copy(这里的零拷贝是针对kernel来讲的,数据在kernel模式下是Zero-Copy)。

正是Linux2.4的内核做了改进,Java中的TransferTo()实现了Zero-Copy,如下图:
这里写图片描述

Zero-Copy技术的使用场景有很多,比如Kafka, 又或者是Netty等,可以大大提升程序的性能。


参考资料

  1. Zero-Copy&sendfile浅析
  2. Efficient data transfer through zero copy
  3. Kafka Zero-Copy 使用分析
  4. 理解Netty中的零拷贝(Zero-Copy)机制

欢迎跳转到本文的原文链接:https://honeypps.com/backend/what-is-zero-copy/


欢迎支持笔者新作:《深入理解Kafka:核心设计与实践原理》和《RabbitMQ实战指南》,同时欢迎关注笔者的微信公众号:朱小厮的博客。


  • 25
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
### 回答1: Qt是一个跨平台的应用程序开发框架,可以用于构建图形用户界面(GUI)和用于非GUI应用程序的扩展库。GPU是图形处理单元的缩写,用于加速图形和计算任务。而零拷贝(Zero-Copy)是一种内存管理技术,它可以减少数据在不同设备之间的复制次数来提高性能。 在Qt中,GPU的零拷贝主要用于加速图形渲染和处理。传统上,绘制和渲染GUI元素需要将数据从主机内存(CPU)复制到GPU内存,这会导致额外的数据传输时延和内存使用。而使用GPU的零拷贝技术,可以直接在主机内存和GPU内存之间共享数据,避免复制操作,从而减少了内存使用和数据传输的开销,提高了图形渲染的性能。 Qt提供了一些方法来实现零拷贝操作。例如,可以使用QOpenGLTexture类在Qt中创建和管理纹理对象,然后将数据直接传输到纹理对象中,而不需要进行额外的复制操作。此外,Qt还提供了与OpenGL集成的功能,可以在GPU上进行图形渲染和计算,进一步提高绘制和渲染性能。 总的来说,Qt GPU零拷贝是一种通过减少CPU和GPU之间的数据复制来提高图形渲染和处理性能的技术。通过在Qt中集成GPU和使用零拷贝技术,可以更高效地利用图形处理能力,提供更流畅和响应快速的用户界面体验。 ### 回答2: Qt的GPU零拷贝是指在使用Qt框架进行图形处理时,通过充分利用现代GPU的功能,实现在CPU和GPU之间进行无拷贝传输数据的技术。 在传统的图形处理流程中,CPU负责将图形数据从内存中复制到GPU的显存中,再由GPU进行处理和渲染。这种方式在大规模图形数据处理时会产生大量的数据复制,造成性能上的浪费。而Qt的GPU零拷贝技术则能够避免这种浪费,提高图形处理的效率。 Qt的GPU零拷贝技术通过利用现代GPU的高速内存访问能力,将数据直接从CPU内存传输到GPU内存,而不需要进行数据拷贝。这样可以减少数据的复制次数,节省了时间和资源。 通过Qt的GPU零拷贝技术,可以在图形数据传输和处理过程中减少内存带宽消耗,提高系统的响应速度和性能,特别是在大规模数据处理和复杂图形场景下。这对于实时图形处理、游戏开发、虚拟现实等领域都具有重要意义。 总之,Qt的GPU零拷贝技术通过充分利用GPU的特性,实现了在CPU和GPU之间进行图形数据传输的无拷贝处理,提高了系统的图形处理效率和性能。 ### 回答3: qt gpu zero-copy是一种用于在Qt图形用户界面框架中实现零拷贝(Zero-copy)的技术。零拷贝是指在数据传输过程中避免对数据进行不必要的复制或移动,以提高数据传输的效率。 在使用Qt进行图形渲染时,通常需要将图像数据从CPU传输到GPU进行处理。传统的方式是通过拷贝数据到GPU的内存空间中,然后再进行处理。而使用Qt gpu zero-copy技术,可以直接将数据从CPU内存中传输到GPU内存中,避免了不必要的数据拷贝操作,提高了图像处理的效率。 Qt gpu zero-copy技术通过使用QOpenGLTexture将图像数据直接映射到GPU内存中实现零拷贝。通过这种方式,可以避免将数据从CPU内存复制到GPU内存的过程,减少了数据传输的延迟和带宽占用。 使用Qt gpu zero-copy技术可以在一定程度上提高图形渲染的性能和效率,特别是对于需要频繁传输大量图像数据的应用程序,如图形编辑器、游戏等。同时,这项技术还能减少内存的占用,提高系统的整体性能和响应速度。 总之,Qt gpu zero-copy是一种通过直接将图像数据从CPU传输到GPU内存来实现零拷贝的技术。它可以提高图形渲染的效率和性能,减少数据传输的延迟和带宽占用,同时降低内存占用,提高系统的整体性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值