什么是零拷贝?

在这里插入图片描述
传统的 Linux 系统的标准 I/O 接口(read、write)是基于数据拷贝的,也就是数据都是 copy_to_user
或者 copy_from_user,这样做的好处是,通过中间缓存的机制,减少磁盘 I/O 的操作,但是坏处也很明
显,大量数据的拷贝,用户态和内核态的频繁切换,会消耗大量的 CPU 资源,严重影响数据传输的性
能,统计表明,在Linux协议栈中,数据包在内核态和用户态之间的拷贝所用的时间甚至占到了数据包整
个处理流程时间的57.1%


零拷贝就是上述问题的一个解决方案,通过尽量避免拷贝操作来缓解 CPU 的压力。零拷贝并没有真正做
到“0”拷贝,它更多是一种思想,很多的零拷贝技术都是基于这个思想去做的优化

零拷贝技术详解

在现代计算系统中,数据传输效率对于提高应用程序的性能至关重要。零拷贝技术是一种高效的数据传输方法,它旨在减少数据在内存中的复制次数,从而提高系统性能。本文将详细介绍零拷贝技术的概念、原理、优势以及其实现方式。

1. 什么是零拷贝?

零拷贝(Zero Copy)技术是一种计算机执行操作时,CPU 不需要先将数据从某处内存复制到另一个特定区域的方法。换句话说,零拷贝技术可以减少数据在系统内存中的复制次数,从而减少 CPU 的负担和内存带宽的使用。

在这里插入图片描述

2. 为什么需要零拷贝?

传统的数据传输过程中,数据往往需要多次在不同的内存区域之间复制。例如,在从磁盘读取文件并通过网络发送时,数据可能会经历多次复制:

  1. 从磁盘读取数据到内核空间的缓冲区。
  2. 将数据从内核空间复制到用户空间的应用程序缓冲区。
  3. 如果需要修改数据,可能会在用户空间再次复制。
  4. 将数据从用户空间复制回内核空间,准备通过网络发送。
  5. 数据从内核空间的网络缓冲区复制到网络设备。

这样的过程不仅消耗了大量的 CPU 时间,还增加了内存带宽的压力。零拷贝技术的目标是减少这些不必要的复制操作,提高数据传输效率。

3. 零拷贝的优势

零拷贝技术的主要优势包括:

  • 减少 CPU 负担:减少数据复制次数可以显著减轻 CPU 的负担。
  • 提高内存带宽利用率:避免不必要的数据复制,减少内存带宽的消耗。
  • 提高吞吐量:减少上下文切换和数据复制,可以提高系统的吞吐量。
  • 减少延迟:更快的数据传输可以减少应用程序的响应时间。

4. 零拷贝的实现方式

零拷贝技术可以通过多种方式实现,以下是几种常见的实现方法:

4.1 利用直接 I/O

直接 I/O 是一种绕过操作系统缓存的 I/O 方式。在直接 I/O 模式下,数据直接从磁盘读取到用户空间的缓冲区,或者直接从用户空间的缓冲区写入磁盘。这种方式减少了数据在内核空间和用户空间之间的复制。

4.2 利用内存映射文件

内存映射文件是一种将文件映射到进程的地址空间的技术。通过内存映射文件,文件的内容可以直接在用户空间的缓冲区中访问,而无需显式地读取到内核空间然后再复制到用户空间。
在这里插入图片描述

4.3 利用文件通道 (File Channels)

在 Java 中,可以利用 NIO(New I/O)中的 FileChannels 和 Transfer Methods 来实现零拷贝。例如,可以使用 transferTo()transferFrom() 方法直接从文件通道读取数据到网络通道,或者从网络通道读取数据到文件通道,而不需要显式地将数据复制到缓冲区中。

4.4 利用 DMA 技术

DMA(Direct Memory Access)是一种允许外部设备直接访问内存的技术,而无需 CPU 的干预。在某些情况下,可以通过 DMA 技术直接将数据从外部设备传输到内存,或者从内存传输到外部设备。
在这里插入图片描述

4.5 利用 Socket 直接读写

在 Linux 系统中,可以使用 sendfile() 函数直接从文件描述符读取数据并发送到网络,而不需要显式地将数据复制到用户空间缓冲区。

4.6 堆外内存

在 Java 中,堆外内存(Off-Heap Memory 或 Direct Buffer)是一种不受 JVM 管理的内存。通过使用堆外内存,可以直接从网络接收或发送数据,而无需将数据复制到 JVM 的堆内存中。

示例:使用 sendfile 实现零拷贝

在 Linux 中,sendfile 系统调用允许直接从文件描述符读取数据并发送到网络,而不需要显式地将数据复制到用户空间缓冲区。这是一个非常有效的零拷贝实现方式。

1. 客户端代码 (client.c)

客户端代码用于接收从服务器发送过来的数据。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netinet/in.h>

#define BUFFER_SIZE 4096
#define PORT 12345

int main(int argc, char *argv[]) {
    int sockfd;
    struct sockaddr_in serv_addr;
    char buffer[BUFFER_SIZE];
    ssize_t n;

    // 创建套接字
    sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd < 0) {
        perror("ERROR opening socket");
        exit(1);
    }

    // 设置服务器地址
    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_port = htons(PORT);
    serv_addr.sin_addr.s_addr = inet_addr("127.0.0.1"); // 本地回环地址

    // 连接到服务器
    if (connect(sockfd, (struct sockaddr *) &serv_addr, sizeof(serv_addr)) < 0) {
        perror("ERROR connecting");
        exit(1);
    }

    printf("Connected to server.\n");

    while (1) {
        // 从服务器接收数据
        n = recv(sockfd, buffer, BUFFER_SIZE, 0);
        if (n > 0) {
            printf("Received %ld bytes from server.\n", n);
            // 输出接收到的数据
            fwrite(buffer, 1, n, stdout);
        } else if (n == 0) {
            printf("Connection closed by server.\n");
            break;
        } else {
            perror("recv failed");
            break;
        }
    }

    close(sockfd);
    return 0;
}

2. 服务器代码 (server.c)

服务器代码用于从文件读取数据并使用 sendfile 发送到客户端。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <sys/sendfile.h>

#define BUFFER_SIZE 4096
#define PORT 12345

int main(int argc, char *argv[]) {
    int sockfd, newsockfd, filefd;
    socklen_t clilen;
    struct sockaddr_in serv_addr, cli_addr;
    ssize_t n;
    char buffer[BUFFER_SIZE];
    int numbytes;

    // 创建套接字
    sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd < 0) {
        perror("ERROR opening socket");
        exit(1);
    }

    // 设置服务器地址
    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_addr.s_addr = INADDR_ANY;
    serv_addr.sin_port = htons(PORT);

    // 绑定套接字
    if (bind(sockfd, (struct sockaddr *) &serv_addr, sizeof(serv_addr)) < 0) {
        perror("ERROR on binding");
        exit(1);
    }

    // 开始监听连接
    listen(sockfd, 5);
    clilen = sizeof(cli_addr);

    printf("Server listening...\n");

    // 接受客户端连接
    newsockfd = accept(sockfd, (struct sockaddr *) &cli_addr, &clilen);
    if (newsockfd < 0) {
        perror("ERROR on accept");
        exit(1);
    }

    printf("Connected to client.\n");

    // 打开文件
    filefd = open("example.txt", O_RDONLY);
    if (filefd < 0) {
        perror("ERROR opening file");
        exit(1);
    }

    // 使用 sendfile 从文件读取数据并发送到客户端
    numbytes = sendfile(newsockfd, filefd, NULL, 0); // 第四个参数为偏移量,NULL 表示从文件开头开始读取
    if (numbytes < 0) {
        perror("sendfile failed");
        exit(1);
    }

    printf("Sent %ld bytes to client.\n", numbytes);

    // 关闭文件和套接字
    close(filefd);
    close(newsockfd);
    close(sockfd);

    return 0;
}
3. 编译和运行
  1. 编译客户端:

    gcc -o client client.c
    
  2. 编译服务器:

    gcc -o server server.c
    
  3. 运行服务器:

    ./server
    
  4. 运行客户端:

    ./client
    

4. 解释

在这个示例中,服务器首先创建一个 TCP 套接字,并开始监听连接。当客户端连接到服务器后,服务器使用 sendfile 系统调用直接从文件描述符读取数据并发送到客户端,而不需要显式地将数据复制到用户空间缓冲区。客户端则接收这些数据并输出到标准输出。

通过这种方式,数据从文件到网络的传输过程中只经过了一次复制(从文件描述符到网络栈),从而实现了零拷贝的效果。


  • 21
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值