1 在分布式环境下,计算机之间的函数调用(RPC)的返回时间通常是毫秒或亚毫秒级(0.1-1.0毫秒),所以分布式环境下的RPC通常采用异步调用方式。
2 常见存储引擎:hash B-Tree LSM-Tree
常见数据模型:文件 关系 表格 K-V
3 分布式系统涉及数据分布、复制、一致性、容错、可扩展性等分布式技术。
4 分布式存储系统要解决的问题:
(1)数据分布
(2)数据一致性
(3)分区容错性
(4)高可用
(5)事务控制
(6)负载均衡
(7)压缩/解压缩
5 常见主流分布式存储系统
(1)分布式文件系统:Facebook Haystack、TFS、GFS、EBS
(2)分布式键值系统:Amazon Dynamo、Tair
(3)分布式表格系统:Bigtable、Megastore、Azure Table、DynamoDB
(4)分布式数据库: RDS、 MySql、 SQL Azure、Spanner
6 事务的ACID特性: 原子性、一致性、隔离性、持久性
7 LSM树采用批量转储技术避免磁盘的随机写入。