Intro & Related Work
Cassandra 来自于 Facebook 的分布式存储系统,目的是取得可拓展性和高可用性,一开始主要为了 Inbox Search 这个功能设计,该功能要求系统能处理高频的写入吞吐量,为了减少延迟也要求跨地域部署。相关工作这部分简述了几个代表性的分布式存储系统实现,包括 GFS,Dynamo,Bayou,Ficus 等,讲了他们在架构设计、副本设计、冲突解决等因素上的权衡选择。
数据模型
Cassandra 里 table 每行都有唯一 key,string 类型无长度限制,一般16~36字节间,对每个副本来说对某一行的操作不论设计多少 column 都是原子的,column 被设计成 column family 的形式,很像 BigTable,但是有两种类型,一种 Simple 的一种 Super,Super 的就是 family 嵌套 family。系统可以允许 columns 按 name 或者时间排序。
定位 column 的方式很简答,column_family:column 或者对于 super 来说就是 column_family:super_column:column。
系统架构
限于篇幅只介绍 Cassandra 使用的 Partitioning、Replication、membership、failure handling 和 scaling。
对写操作将请求路由至所有副本,等待大多数副本回应则成功;对读请求则根据客户端的策略是路由到最近的副本还是路由到所有副本等到多数回应,前者不在意一致性,后者在意一致性。