cassandra的数据分布和副本策略

最新推荐文章于 2023-01-04 11:22:26 发布

yuanchao99

最新推荐文章于 2023-01-04 11:22:26 发布

阅读量7.6k

点赞数 1

分类专栏： cassandra

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanchao99/article/details/8583134

版权

cassandra 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

由于cassandra集群的每个节点是对等的，所以数据的分布和副本是在一起的。

数据是通过表组织起来的，通过行键（主键）标识，主键决定了数据存储在哪个节点。每一行会有多个副本(replica)，注意第一份数据也被称为副本。

当建立一个集群时，必须指定以下内容：

虚拟节点：把数据分配到物理机器节点

分片器：在整个集群中对数据进行分片

副本策略：决定每行数据的副本

Snitch: 决定副本策略的拓扑信息。

数据分布

1.一致性hash

cassandra为每个主键计算一个hash值，为每个节点指定一个其负责的hash值范围，根据主键hash值和节点负责的hash值范围将不同的行存储到不同的节点。

2.数据如何分布

在1.2之前，必须为每个节点分配一个token，每个token决定了节点在集群环上的位置以及它负责保存的数据（根据主键hash值）。

1.2版引入了虚拟节点，允许每个节点拥有多个小的hash范围。虚拟节点也使用一致性hash分布数据，但是不需要产生和分配token。

如下图所示：

副本策略

一行有几个副本由副本因子参数决定，1表示每行只有一个副本，2表示每行有2个副本，保存子不同的节点上。所有的节点都同样重要，没有主次之分。

副本数量应该不超过集群节点的数量。有两种副本策略：

SimpleStrategy:适用于只有一个数据中心的状况。第一个副本的存储位置由分片器（partitioner）决定，其他副本按照顺时针方向依次放在其它节点。

NetworkTopologyStrategy: 推荐方式，因为可以扩展到多数据中心。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄17年

118
原创

61
点赞

155
收藏

90
粉丝

关注

私信

热门文章

分类专栏

最新评论

将Ubuntu系统语言环境改为英文的en_US.UTF-8
小污龟1: 能不装新东西就不装，可以先试一下 [code=plain] sudo locale-gen "en_US.UTF-8" [/code] [code=plain] sudo update-locale LANG=en_US.UTF8 [/code]
FHIR概述
weixin_40862115: 东软汉枫医疗科技有限公司的围手术期智慧决策系统是全FHIR实现的，他们通过FHIR实现了临床科研一体化设计，实现了术中患者并发症监测预警，并实现了围术期专科数据资源库的建设，他们为监护类真实世界研究工具起了个名字，叫“数据优选系统”，实现了临床诊疗过程中的数据直接符合科研要求、可以拿来做科研。但是因为FHIR在中国还没有实现汉化、定义，因为涉及到语言符号系统、人类个体对概念理解的理论，听说汉枫将FHIR做了中国区汉化，并统一了中英文符号系统，利用FHIR实现了知识图谱的框架，并且将MIMIC-III、MIMIC-III-WAVE都成功转成了FHIR R4.0. 目前东软汉枫医疗科技有限公司可能是国内在FHIR使用领域走得最远的一家企业了。
如何为chrome浏览器设置socks5代理
oaoutoaout: 你这socks5配置验证确认生效吗？
opentsdb学习-写入数据
柴咪油盐: 后来你是怎么处理的
Django自定义User模型和登录验证
Tisfy: 我直接一个好家伙

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。