kafka集群为什么需要三个节点_分布式集群系统的原理分析——ZK、Kafka和RS

最新推荐文章于 2024-06-30 20:38:07 发布

weixin_39884270

最新推荐文章于 2024-06-30 20:38:07 发布

阅读量5.6k

点赞数 4

文章标签： kafka集群为什么需要三个节点

本文探讨了为什么需要构建分布式集群，并以Kafka为例，解释了Kafka集群中需要三个节点的原因。文章还介绍了CAP理论、Base理论，以及解决分布式存储问题的方法，如数据块技术、协调节点和大多数投票机制。同时，文章讨论了Elasticsearch和Kafka在数据一致性方面的配置选项，并提到了集群脑裂的问题和大多数投票机制的优缺点。

摘要由CSDN通过智能技术生成

写在前面

在当今信息爆炸的时代，单台计算机已经无法负载日益增长的业务发展，虽然也有性能强大的超级计算机，但是这种高端机不仅费用高昂，也不灵活，一般的企业是负担不起的，而且也损失不起，那么将一群廉价的普通计算机组合起来，让它们协同工作就像一台超级计算机一样地对外提供服务，就成了顺其自然的设想，但是这又增加了软件的复杂度，要求开发的软件需要具备横向扩展能力，比如：Kafka、Elasticsearch、Zookeeper等就属于这一类软件，它们天生都是"分布式的"，即可以通过添加机器节点来共同地分摊数据存储和负载压力。

为什么需要集群？

分布在不同区域的计算机，彼此之间通过网络建立通信，相互协作作为一个整体对外提供服务，这就是集群，如果我们开发的系统具备这样的能力，那么理论上就具备无限横向扩容的能力，系统的吞吐量就会随着机器数增加而增长，那么未来当系统出现高负载的时候，就可以很好地应对这种情况。

为什么CAP不能同时满足？

通过上面分析，我们知道实现集群，其实就是采用多台计算机来共同承担和负载系统压力，那么就涉及到多台计算机需要参与一起处理数据，为了保证可用性，一般都会在每台计算机上备份一份数据，这样只要有一个节点保持同步状态，那么数据就不会丢失，比如kafka分区多副本、Elasticsearch的副本分片，由于同一数据块及其副本位于不用的机器，随着时间的推移，再加上不可靠的网络通信，所有机器上的数据必然会不完全一致，这个时候假如发生一种极端情况，所有的机器宕机了，又如何保证数据不丢失呢(其实只有两种方法)？