Apache IoTDB 分布式架构三部曲（三）副本与共识算法

本文链接：https://blog.csdn.net/qin_DB/article/details/139538962

IoTDB 首创并应用的共识协议统一框架，为用户提供了灵活选择不同共识算法的可能性。

对于一个分布式集群而言，为了使得海量数据场景下集群能够横向扩展，集群需要按照一定的规则将全部数据分成多个子集存储在不同的节点上，从而能够更加充分地利用到集群中各个节点的存算资源。对于集群中的任何一个分片而言，为了满足高可用的需求，需要将数据在多个物理节点上冗余存储多个副本，进而避免单点故障的出现。

由于同一份数据有多个副本，可能会出现不同副本间数据不一致的现象。现有的分布式系统一般通过共识算法来处理多个副本间的数据一致性问题。

然而，不同的业务场景对共识算法的一致性、可用性等要求不同。比如对于应用监控场景，Google 的时序数据库 Monarch 就明确指出对于监控场景的时序数据其会更关注可用性而不是一致性。不过对于数据分区等关键元信息，其依然使用了保证外部一致性的 Spanner 数据库进行管理。

对于专为物联网场景而生的分布式时序数据库 IoTDB 而言，针对时序数据，往往可以根据场景选择可用性更好的共识算法；而针对分区信息和元数据等核心信息，往往可以选择一致性较强的共识算法。

本文将从共识算法讲起，深入解析 IoTDB 对于共识算法一致性、可用性和性能等方面的选择与取舍，并介绍 IoTDB 独有的共识算法框架，帮助您理解并掌握 IoTDB 的多种共识策略，从而根据您的业务需要对共识算法进行灵活的选择与配置。

共识算法

（1）为什么需要共识算法

前面一期（分布式架构三部曲（二））提到，分布式系统通过将数据进行分片，并在多个物理节点冗余存储为多个副本的横向扩展方式来提升系统整体的可用性和性能。IoTDB 采取横向扩展的分布式架构，如下图所示。