GT4中的数据管理部分综述
globus工具集提供了许多处理数据管理的组件。这里展示了高层次的综述,下面的组件链接中给出了独立组件的详细信息。
数据管理可用的模块分成两个基本的类别:数据移动和数据复制。
第一章:数据移动
在globus工具集中有两个数据移动相关的组件:globus GridFTP工具和globus 可靠文件传输(RFT)服务
1.GridFTP
GridFTP是GFD(网格建议论坛)定义的一个协议,并且是IEFT FTP工作组之前的一个草稿。GridFTP协议提供安全,健壮,快速和高效的数据传输。globus工具集提供了这个协议最常用的实现,尽管其他已经存在了(主要关联到私有的内部系统)。
globus工具集提供了:
一个叫做globus-gridftp-server的服务器实现,
一个叫做globus-url-copy的可脚本化的命令行客户端
一套用于定制客户端的开发函数库
虽然globus工具集不提供交互式客户端,GridFTP用户指南确实提供了至少是一个由其他项目开发的交互式客户端。
如果你想让数据对于他人可用,你需要在主机上安装一个可以访问那些数据的服务器并且确保有一个对于这个存储系统可用的合适的数据存储接口(DSI)持有这些数据。这典型地意味着一个标准的POSIX文件系统,但是DSIs对于存储资源代理(SRB)确实存在,高性能存储系统(HPSS),和Wisconsin大学Condor团队中的NeST--Madison。这有DSIs的完整目录.如果你需要的存储系统的接口没有列在这,或者使用这个系统的一个足够广泛的团体被确定,我们可以有能力获得联合资金来开发必要的接口。
如果你只是想存取别人使之可用的数据,你需要一个GridFTP客户端。globus工具集为这个目的提供了一个叫做globus-url-copy的客户端。这个客户端能通过一系列协议(http,https,ftp,gsiftp,和file)来存取数据。如上所述他不是一个交互式客户端,但是一个命令行接口,适合脚本化。如例所示,下面的命令:
globus-url-copy gsiftp://remote.host.edu/path/to/file file:///path/on/local/host
会从一个远端主机传输一个文件到本地可访问的在第二个URL中指定的路径
最终,如果你想添加通向存储在GridFTP服务器下文件的入口,或