分布式存储系统是大量普通PC服务器通过Internet互联,对外作为一个整体提供存储服务。
- 特性:
可扩展;低成本;高性能;易用。
- 技术:
- 数据分类
结构化数据:关系数据
半结构化数据
- 分布式文件系统
Facebook Haystack;
Taobao File System(TFS);
Google File System(GFS);
Amazon EBS
三种类型的数据:Blob(Binary Large Object);定长块;大文件
- 分布式键值系统
CRUD
Amazon Dynamo;
Taobao Tair、Memcache;
- 分布式表格系统
CRUD、支持扫描某个主键范围;针对单张表格的操作,不支持多表关联、联结、嵌套子查询等复杂的操作
Google Bigtable;
Megastore;
Microsoft Azure Table Storage;
Amazon DynamoDB.
- 分布式数据库
MySQL Sharding;
Amazon RDS;
Microsoft SQL Azure;
Google Spanner;
Alibaba OceanBase.