项目需求
北京大学物理学院
·更快的IO性能
·极高的写入带宽
·完善的数据保护机制
·全天候可靠性
北京大学物理学院下辖2个教学实体单位,8个研究系所,同时依托学院建立了人工微结构和介观物理国家重点实验室等多个科研机构,研究方向涵盖了物理科学及相关的主要领域。
用户目前使用的是传统的磁盘阵列存储,存储空间几乎占满,扩容成本巨大,而且随着硬盘框的扩容,存储性能逐渐递减,数据保护机制远不及分布式存储,其业务场景是对科研数据的存储(如Matlab、Nlc等专业软件绘图),并对这些数据进行分析、处理,与XDFS在大文件场景下的使用十分契合。
01 分布式存储系统的特点
用户考虑采用更为先进的分布式存储架构,采购一套5节点的XDFS分布式存储系统,裸容量不低于1070TB,做4+1纠删码卷后,有效容量856TB,并考虑性能、扩展能力和可靠性。通过对用户当前应用环境和未来业务扩展的分析,总结用户对本次分布式存储系统建设具有以下的需求和特点。
1、更快的IO性能
用户是北京大学物理学院,主要存储并分析一些科研数据,是典型的大文件存取,大IO操作,需要持续的高性能。此外,文件数量一直保持快速增加状态,需要文件系统具备很强的文件组织和管理能力。
2、极高的写入带宽
应用环境中,有17台客户端对图片或视频等素材并发读取或写入,这对存储 I/O 带宽、数据吞吐量有极高要求。网络和存储性能直接影响整个的效率。
3、完善的数据保护机制
业务数据是客户的核心资产,也是业务系统赖以运行的基础,需要进行可靠、有效的数据保护。
4、全天候可靠性
存储系统支持多台客户端的并发读取和整个图文视频应用的在线服务,需要7x24不间断运行。
02 XDFS解决存储空间不足,读写性能低等问题
根据用户的需求并结合用户的实际应用场景,在该项目中采用XDFS分布式文件系统存储,为用户构建海量、高效、可扩展的分布式文件系统存储。
本次项目配置5个XDFS存储节点,单个节点配置2块480G SSD硬盘,22块12TB NL-SAS硬盘,单个节点数据盘做两组RAID5,划分为4个VD。创建4+1纠删码卷。单个节点配置1个千兆网口作为管理网络,2个IB网口(做绑定)作为业务网络。客户端使用rdma协议挂载。
03 高性能、弹性扩展、高可靠·高可用
1、卓越的性能
XDFS分布式文件存储系统,提供分布式的文件读写和共享服务,本次配置的5节点集群单客户端挂载可实现1.5GB/s的写性能,1GB/s的读性能。5个客户端并发可实现6GB/s的写性能,4GB/s的读性能。
2、弹性的可扩展存储架构
采用完全去中心化的的分布式文件存储架构,无独立元数据服务器设计,消除元数据信息交互瓶颈;Scale-out动态扩展,快速在线增删节点,最高可实现1024个节点集群,可管理近100PB的海量数据,并以全局命名空间的形态实现存储资源的呈现,为客户端提供统一的逻辑视图和资源访问入口。
3、极高的可靠性与可用性
分布式集群架构,全活冗余节点,节点故障后可在数秒内实现故障接管;实时一致的数据副本及智能自修复机制;可选采用纠删码保护,提升容量利用率。整个集群存储具有数据的可靠性、可恢复性和存储服务的高可用性,可有效支持业务的连续性。
客户价值
XDFS分布式存储方案上线后,轻松替代原有的FC存储系统,提供了充足的可用空间,及上GB级读写带宽。大大加速了物理学院科研系统Matlab等应用的运行速度,有效提升了师生们的学习和工作效率。
XDFS弹性的扩展能力,可以随时匹配用户科研任务的增长,通过简单的在线增加节点,即可满足业务更高的容量与性能需求。