1. 概念
分布式存储系统:大量普通PC服务器通过Internet互联,对外作为一个整体提供存储服务。
特点:可扩展, 低成本,高性能,易用
- 可扩展: 分布式存储系统扩展几百台甚至几千台的集群规模,而且随着集群规模的增长,性能程线性增长。
- 低成本:分布式存储系统的自动容错、自动负载均衡机制可使其构建在普通PC机之上。 线性扩展使得增加减少机器方便,实现自动运维。
- 高性能:单点还是整个集群,都要求分布式存储系统具备高性能。
- 易用:分布式存储系统需要能够提供易用的对外接口,另外也要求具备完善的监控、运维工具,并能够方便地与其他系统集成。
分布式存储系统的挑战主要在于数据、状态信息的持久化,要求在自动迁移、自动容错、并发读写的过程中保证数据的一致性。所涉及的技术来自两个领域: 分布式系统,以及数据库
2. 分类
分布式存储面临数据需求分为:
- 非结构化数据: 文本,图片,音频。。。
- 结构化数据: 关系型数据库
- 半结构化数据:HTML文档
分布式文件系统分为四类:
1. 分布式文件系统, 2. 分布式键值(key- value)系统 , 3. 分布式表格系统 和 4. 分布式数据库
end 2019.11.7