CAP理论一致性哈希算法

最新推荐文章于 2023-12-27 18:06:33 发布

小小毛毛虫~

最新推荐文章于 2023-12-27 18:06:33 发布

阅读量748

点赞数

文章标签： CAP 一致性哈希

本文链接：https://blog.csdn.net/Lyncai/article/details/122959288

版权

本文探讨了一致性哈希算法如何应用于分布式缓存系统，如Memcached，以解决热点数据分布不均的问题。通过虚拟节点技术，它确保了在高可用性和分区容错性的背景下，数据负载均衡。同时，对比了CAP理论在不同应用场景下的权衡选择。

摘要由CSDN通过智能技术生成

一致性哈希算法

最初提出是为了解决分布式Cache，网络中的热点（Hot spot）问题

memcached服务器端本身不提供分布式cache的一致性，而是由客户端来提供，具体在计算一致性hash时采用如下步骤：

一致性哈希解决数据分布不一致造成的数据倾斜问题？

引用虚拟节点，通过虚拟节点的二次映射解决数据分布不均引起的节点负荷不均。

CAP ： 分布式中的理论： 一致性、可用性、分区容错性。三者不可兼得，只能保证其中两个。因此，任何分布式系统的设计是三者之间的取舍。

分布式场景Webservice

一个Webservice后台运行着众多servers 对webservice的读写会反映到后台的server集群，并对CAP进行定义：

高可用、数据一致是很多分布式设计的目标，但是高可用不可避免的是分区

CA without P：如果不要求P（不允许分区），则C（强一致性）和A（可用性）是可以保证的。但其实分区不是你想不想的问题，而是始终会存在，因此CA的系统更多的是允许分区后各子系统依然保持CA。
CP without A：如果不要求A（可用），相当于每个请求都需要在Server之间强一致，而P（分区）会导致同步时间无限延长，如此CP也是可以保证的。很多传统的数据库分布式事务都属于这种模式。
AP wihtout C：要高可用并允许分区，则需放弃一致性。一旦分区发生，节点之间可能会失去联系，为了高可用，每个节点只能用本地数据提供服务，而这样会导致全局数据的不一致性。现在众多的NoSQL都属于此类。