【摘要】本文从可靠性、可用性、IO 性能、数据存储效率、安全性、可管理性等多方面对分布式存储系统进行了描述,对希望了解分布式存储系统的读者很有帮助
一、 内容总括
分布式存储系统是基于分布式架构,由多个软硬件协同的存储节点通过网络互联来提供存储服务的系统。或简言之,分布式存储系统使用分布式的方法来提供存储服务。
分布式存储系统首先是存储系统。作为存储存储系统,最基本的需求是提供系统的可靠性和可用性。可靠性是指,用户在存储系统写入的数据不能丢,读取的数据不能错;可用性是指,系统提供的服务不中断。
除了可靠性和可用性,存储系统还需要具备高性能、高数据存储效率、高安全、易管理等特点。高性能是指系统提供高 IOPS 、高带宽、低时延;高数据存储效率是指,存储系统利用数据缩减方法(如 RAID 、 EC 、重删、压缩等)使用户写入的数据占用尽量小的存储空间;高安全主要针对存储系统的用户业务、存储设备、存储网络等,需要保证它们不易受到安全威胁和攻击,即使受到攻击后也易于恢复;易管理是指系统在生命周期内可以进行方便的配置、维护、优化等。
分布式存储是使用分布式的方法设计的,必然具有分布式系统的特点。这些特点包括易扩展、融合存储服务、生态开放等。易扩展是指可以在方便地在已有的分布式存储系统中添加(或缩减)节点,并且系统的整体性能( IOPS 、带宽)和节点数量(近)线性相关;融合服务能力是指存储系统可以同时支持块、文件、对象、 HDFS 等多种存储服务;生态开放是指分布式存储不仅可以方便地对接各种上层应用,其系统自身的软硬件也具有相对开放的生态。
人们总是追求完美的产品。对于分布式存储产品,也不例外。比如数据高可靠要