[论文笔记] Cassandra - A Decentralized Structured Storage System

最新推荐文章于 2024-07-28 22:59:32 发布

Young.Chen

最新推荐文章于 2024-07-28 22:59:32 发布

阅读量907

点赞数

分类专栏： Paper Reading Distributed System 文章标签： Cassandra 论文笔记分布式系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chen_kkw/article/details/82379387

版权

这篇论文笔记详细介绍了Cassandra的设计理念和架构，包括其数据模型、分区策略、复制机制和高可用性设计。Cassandra是一个为高频写入和跨地域部署优化的分布式存储系统，采用一致性哈希分区，支持多种复制策略，并利用Zookeeper进行节点管理和故障处理。此外，还介绍了其数据持久化和查询优化策略，如使用commit log和布隆过滤器。

摘要由CSDN通过智能技术生成

Cassandra 来自于 Facebook 的分布式存储系统，目的是取得可拓展性和高可用性，一开始主要为了 Inbox Search 这个功能设计，该功能要求系统能处理高频的写入吞吐量，为了减少延迟也要求跨地域部署。相关工作这部分简述了几个代表性的分布式存储系统实现，包括 GFS，Dynamo，Bayou，Ficus 等，讲了他们在架构设计、副本设计、冲突解决等因素上的权衡选择。

数据模型

Cassandra 里 table 每行都有唯一 key，string 类型无长度限制，一般16~36字节间，对每个副本来说对某一行的操作不论设计多少 column 都是原子的，column 被设计成 column family 的形式，很像 BigTable，但是有两种类型，一种 Simple 的一种 Super，Super 的就是 family 嵌套 family。系统可以允许 columns 按 name 或者时间排序。

定位 column 的方式很简答，column_family：column 或者对于 super 来说就是 column_family：super_column：column。

系统架构

限于篇幅只介绍 Cassandra 使用的 Partitioning、Replication、membership、failure handling 和 scaling。

对写操作将请求路由至所有副本，等待大多数副本回应则成功；对读请求则根据客户端的策略是路由到最近的副本还是路由到所有副本等到多数回应，前者不在意一致性，后者在意一致性。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。