一、NFS结构
传统的nfs结构包括:一个共享文件系统的服务器端、一个挂载文件系统的客户端。存储器位于服务器端。当客户端想访问存储器上的文件时,要经过网络连接到服务器端,进而访问到文件,即带内访问。这样会受到带宽等因素的干扰,使性能收到影响。NFS 的最新许可版本是 NFS version 4。
二、pNFS结构
NFS的下一个修改版本是version 4.1,包括一个扩展 Parallel NFS(pNFS)。它将普通 NFS 的优势和并行输入输出(I/O)的高传输率结合起来。它与NFS的区别在于,客户端、服务器均与存储器直接相连,客户端不必再通过服务器间接访问存储器了,即带外访问,再也不用收到带宽等因素的干扰,性能大大提高。
三、pNFS具体实现细节
上图显示一个 pNFS 配置。左边是pNFS服务器。顶部是客户机节点。底部是数据仓库,也就是存储器。
下面介绍图中三个协议:
- pNFS protocol:在服务器和客户端之间传递元数据(更正式的叫法为“布局”)。包括:文件写入位置、文件属性等。
- storage access protocol:指定客户机访问数据仓库的方式。
- control protocol:同步元数据服务器和数据服务器之间的状态。同步是对客户机隐藏的,比如重新组织介质上的文件。此外,NFSv4.1 并没有规定控制协议;因此它有多种形式,这在性能、成本和特性方面的竞争为供应商提供了灵活性。
四、pNFS的read操作
我们通过read操作来看pNFS具体是怎么实现数据传输的。
- 客户机向服务器发送LOOKUP+OPEN请求,服务器返回文件句柄和状态信息。
- 客户机发送LAYOUTGET命令,服务器返回所需的文件元数据(布局)。
- 客户机拿到元数据后,向存储器发送READ请求。
- 客户机完成读操作后以LAYOUTRETURN表示操作结束。
- 如果客户机拿到的元数据已经过时,服务器将发出CB_LAYOUTRECALL命令,表明该布局过时,必须清除或重新获取。
布局可以缓存到客户机上,从而提高性能。为了避免布局过期,服务器将回收不准确的布局,当回收发生时,每个与之相关的客户机必须停止I/O,重新从服务器获取布局或从普通的NFS访问文件。当服务器进行数据迁移等操作之前,必须执行回收。