在编写程序时有时会涉及到读取硬盘中的数据,并把这些数据不经过处理发送到其他系统中。这个看似简单地操作实际上消耗了大量的cpu资源。为了减少cpu资源的消耗,引入了零拷贝的技术。在java语言中,可以用java的类库`java.nio.channels.FileChannel` 中的`transferTo()`方法来调用linux/unix系统的零拷贝。 下面会对比传统方法和零拷贝两种方法来讲解。
传统方式
传统的方法起始伪代码只要两步
File.read(fileDesc, buf, len);
Socket.send(socket, buf, len);
但是设计到的数据拷贝和操作系统的上下文切换却比较复杂。具体步骤如下:
- 数据拷贝流程
首先简单介绍下上图涉及到的一些概念。
DMA: 是计算机科学中的一种内存访问技术。它允许某些计算机内部的硬件子系统(计算机外设),可以独立地直接读写系统内存,而不需中央处理器(CPU)介入处理 。在同等程度的处理器负担下,DMA是一种快速的数据传送方式。很多硬件的系统会使用DMA,包含硬盘控制器、绘图显卡、网卡和声卡。
DMA传输步骤:
- 能向CPU发出系统保持(HOLD)信号,提出总线接管请求
- 当CPU发出允许接管信号后,负责对总线的控制,进入DMA方式
- 能对存储器寻址及能修改地址指针,实现对内存的读写
- 能决定本次DMA传送的字节数,判断DMA传送是否结束
- 发出DMA结束信号,使CPU恢复正常工作状态
用户态、内核态: 从下图可以更进一步对内核所做的事有一个“全景式”的印象。主要表现为:向下控制硬件资源,向内管理操作系统资源:包括进程的调度和管理、内存的管理、文件系统的管理、设备驱动程序的管理以及网络资源的管理,向上则向应用程序提供系统调用的接口。从整体上来看,整个操作系统分为两层:用户态和内核态,这种分层的架构极大地提高了资源管理的可扩展性和灵活性,而且方便用户对资源的调用和集中式的管理,带来一定的安全性。
- 上下文切换
- read() 调用引发了一次从用户模式到内核模式的上下文切换。在内部,发出 sys_read()(或等效内容)以从文件中