[论文笔记] Cassandra - A Decentralized Structured Storage System

这篇论文笔记详细介绍了Cassandra的设计理念和架构,包括其数据模型、分区策略、复制机制和高可用性设计。Cassandra是一个为高频写入和跨地域部署优化的分布式存储系统,采用一致性哈希分区,支持多种复制策略,并利用Zookeeper进行节点管理和故障处理。此外,还介绍了其数据持久化和查询优化策略,如使用commit log和布隆过滤器。
摘要由CSDN通过智能技术生成

Cassandra 来自于 Facebook 的分布式存储系统,目的是取得可拓展性和高可用性,一开始主要为了 Inbox Search 这个功能设计,该功能要求系统能处理高频的写入吞吐量,为了减少延迟也要求跨地域部署。相关工作这部分简述了几个代表性的分布式存储系统实现,包括 GFS,Dynamo,Bayou,Ficus 等,讲了他们在架构设计、副本设计、冲突解决等因素上的权衡选择。

数据模型

Cassandra 里 table 每行都有唯一 key,string 类型无长度限制,一般16~36字节间,对每个副本来说对某一行的操作不论设计多少 column 都是原子的,column 被设计成 column family 的形式,很像 BigTable,但是有两种类型,一种 Simple 的一种 Super,Super 的就是 family 嵌套 family。系统可以允许 columns 按 name 或者时间排序。

定位 column 的方式很简答,column_family:column 或者对于 super 来说就是 column_family:super_column:column。

系统架构

限于篇幅只介绍 Cassandra 使用的 Partitioning、Replication、membership、failure handling 和 scaling。

对写操作将请求路由至所有副本,等待大多数副本回应则成功;对读请求则根据客户端的策略是路由到最近的副本还是路由到所有副本等到多数回应,前者不在意一致性,后者在意一致性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值