分区器决定了数据在集群中节点的分布。分区器的功能是通过为每一行数据的分区键(partion key)分配一个令牌(token),然后通过这个令牌(token)将数据保存在cassandra集群中。
Cassandra提供了如下如下4种分区器。Cassandra中的实现如下图:
- ByteOrderedPartitioner:有序分区器,它将键值数据看做是裸字节。
- LocalPartitioner:对分区键未做任何处理的分区器。
- Murmur3Partitioner:基于MurmurHash哈希算法,能将数据均匀地分布在集群上。
OrderPreservingPartitioner:令牌是基于键值的UTF-8字符串。各行是按照键值的顺序存储的,按照排序顺序对齐物理结构。此分区器查询并不比随机分区器更有效率——它只提供顺序性。它的一个缺点是非常容易让环不均衡,所以非常有可能导致最后大量数据位于某些节点,而其它节点的数据很少。那些存在很多数据的节点,使得环非常不平衡,常常被看做是“热点”。
Cassandra分区器详解:数据分布策略

本文介绍了Cassandra的分区器,包括ByteOrderedPartitioner、LocalPartitioner、Murmur3Partitioner、OrderPreservingPartitioner和RandomPartitioner。重点讨论了各种分区器的工作原理、优缺点,如Murmur3Partitioner能实现数据均匀分布,而OrderPreservingPartitioner可能导致环不均衡。了解这些分区器有助于优化Cassandra集群的数据分布。
最低0.47元/天 解锁文章
1005

被折叠的 条评论
为什么被折叠?



