分布式与一致性协议之PBFT算法(二)

coffee_babe

于 2024-05-12 14:45:07 发布

阅读量708

点赞数 26

分类专栏：分布式一致性文章标签：分布式一致性算法 java 共识算法一致性 PBFT

本文链接：https://blog.csdn.net/Cover_sky/article/details/138755483

版权

分布式一致性专栏收录该内容

37 篇文章 0 订阅

订阅专栏

PBFT算法

如何替换作恶的主节点

虽然PBFT算法可以防止备份节点作恶，因为这个算法是由主节点和备份节点组成的，但是，如果主节点作恶(比如主机点接收到了客户端的请求，但就是默不作声，不执行三阶段协议)，那么无论正常节点数有多少，备份节点肯定无法达成共识，整个集群也将无法正常运行。针对这个问题，我们该如何解决呢？
答案是视图变更，也就是通过领导者选举楚新的主节点，并替换掉作恶的主节点。(其中的"视图"可以理解为领导者任期内不同的视图值对应不同的主节点，比如，视图值为1时，主节点为A;视图值为2时，主节点为B)
需要注意的是，对于领导者模型算法而言，不管是非拜占庭容错算法(比如Raft算法)还是拜占庭容错算法(比如PBFT算法)，领导者选举都是它们实现容错能力非常重要的一环。比如，对Raft算法而言，领导者选举实现了领导者节点的容错能力，避免了因领导者节点故障而导致的整个集群不可用的问题。而对PBFT算法而言，视图变更，除了能解决主节点故障导致的集群不可用的问题之外，还能解决主节点是恶意节点的问题。
既然领导者选举这么重要，那么PBFT算法到底是如何实现视图变更的呢？

主节点作恶会出现什么问题

在PBFT算法中，主节点作恶有如下几种情况:

1.主节点接收到客户端请求后不做任何处理，也就是默不作声
2.主节点接收到客户端请求后给不同的预准备请求分配不同的序号
3.主节点只给部分系欸但发送预准备消息
需要注意的是，不管出现哪种情况，共识都是无法达成的，也就是说，如果恶意节点当选了主节点，此时无论忠诚节点数有多少，忠诚节点们都将无法达成共识。而这种情况肯定是无法接受的，这需要我们设计一个机制，在发现主节点可能作恶时，将作恶的主节点替换掉，并保证最终只有忠诚的节点担任主节点。这样，PBFT算法才能保证当节点数为3f+1(其中f为恶意节点数)时，忠诚的节点们能就客户端提议的指令达成共识，并执行一致的指令。
那么，在PBFT算法中，视图变更是如何选举出新的主节点并替换掉作恶的主节点呢？

如何替换作恶的主节点

在我看来，视图变更是保证PBFT算法稳定运行的关键。当系统运行异常时，客户端或备份节点出发系统的视图变更，通过"轮流上岗"的方式(公式是(V+1) mod |R|, 其中v为当前视图的值，|R|为节点数)选出下一个视图的主节点，最终选出一个忠诚、稳定运行的新主节点，并保证了共识的达成。为了更好地理解视图变更的原理，继续以苏秦为例展开分析，这次，咱们把叛徒楚当作"大元帅",让它扮演主节点的角色，如图所示。在这里插入图片描述

首先，苏秦联系楚，向楚发送包含作战指令"进攻"的请求，如图所示。在这里插入图片描述

当楚接收到苏秦的请求之后，为了达到破坏作战计划的目的，它选择默不作声，心想:我就是不执行三阶段协议，不执行你的指令，也不通知其他将军执行你的指令，你能把我怎么办？
结果，苏秦始终没有接收到两个相同的响应消息。待过了约定的事件后，苏秦会认为也许各位将军们出了什么问题。这时苏秦会直接给各位将军发送作战指令，如图所示。在这里插入图片描述

当赵、魏、韩接收到来自苏秦的作战指令时，它们会将作战指令分别发送给楚，并等待一段时间，如果在这段事件内它们仍未接收到来自楚地预准备消息，那么它们就认为楚可能已经叛变了，并发起视图变更(采用"轮流上岗"的方式选出新的大元帅，比如赵)，向集群所有节点发送视图变更消息，如图所示。在这里插入图片描述

当赵接收到两个视图变更消息后，它就会发送新视图消息给其他将军，告诉大家，我是大元帅了，如图所示。在这里插入图片描述

其他将军在接收到新视图消息后，就认为选出了新的大元帅。然后，忠诚的将军们就可以一致地执行来自苏秦的作战指令了。
你看，叛变的大元帅就这样被发现和替换掉了，而最终大元帅一定是忠诚的。
回到计算机的世界中，我们应该如何理解呢？其实现原理与签名一样，这里不再赘述。不过为了更全面地理解视图变更，补充几点。
首先，当一个备份节点在定时器超时出发了视图变更后，它将暂时停止接收和处理除了检查点(CHECKPOINT)、视图变更、新视图之外的消息。你可以这样理解，这个节点认为现在集群处于异常状态，所以不能再处理客户端请求相关的消息。
其次，除了演示中触发备份节点进行视图变更的情况，下面几种情况也会触发视图变更，列举如下:

1.备份节点发送了准备消息后，在约定的时间内未接收到来自其他节点的2f个相同的准备消息
2.备份节点发送了提交消息后，在约定的时间内危机收到来自其他节点的2f个相同的提交消息
3.备份节点接收到异常消息，比如视图值、序号和已接收的消息相同，但内容摘要不同。
也就是说，视图变更除了能解决主节点故障和作恶的问题，还能避免备份节点长时间阻塞等待客户端请求被执行的情况。
最后需要大家注意的是，Raft算法的而领导者选举和日志提交都是由集群的节点来完成的。但在PBFT算法中，客户端参与了拜占庭容错的实现，比如，客户端实现定时器，等待接收来自备份节点的响应，如果等待超时，则发送请求给所有节点

注意

相比Raft算法完全不适应有人作恶的场景，PBFT算法能容忍(n-1)/3个恶意节点(也可以是故障节点)。另外，相比Pow算法，PBFT算法的有点是不消耗算力，所以在日常实践中，PBFT算法比较适用于相对"可信"的场景，比如联盟链

PBFT算法的局限、解决办法和应用

如同一枚硬币具有正反两面，任何一个算法也会有优缺点，PBFT算法也不例外。接下来，将介绍PBFT算法的局限、解决办法，以及实际应用情况。
首先，在一般情况下，每个节点都需要持久化保存状态数据(比如准备消息)，以便后续使用，但随着系统运行，数据会越来越多，最终肯定会出现存储空间不足的情况，那么，怎么解决这个问题？
答案是检查点机制，PBFT算法实现了检查点机制，来定时清理节点缓存在本地但已经不再需要的历史数据(比如预准备消息、准备消息和提交消息)，节省了本地的存储空间，且不会影响系统的运行。
其次，我们都知道基于数字签名的加解密非常消耗性能，这也是为什么在一些对加解密要求高的场景中，大家常直接在硬件中实现加解密，比如IPSEC VPN。如果在PBFT算法中，所有消息都是签名消息，那么肯定非常消耗性能，且会极大地制约PBFT算法的落地场景，那么有什么办法优化这个问题吗？
答案是将数字签名和消息验证码(MAC)混合使用。具体来说，在PBFT算法中，只有视图变更消息和新视图消息采用签名消息，其他消息则采用消息验证码，这样一来，就可以节省大量加解密的性能开销。
最后，PBFT算法是一个能在实际场景中落地的拜占庭容错算法，它和区块链也结合紧密，具体有以下几个应用:

1.相对可信、有许可限制的联盟链，比如Hyperledger Sawtooth
2.与其他拜占庭容错算法结合来落地公有链，比如Zilliqa，将Pow算法和PBFT算法结合起来，实现公有链的共识协商。具体来说，PoW算法用于认证，证明节点不是"坏人"，PBFT算法用于实现共识。针对PBFT算法消息数过多、不适应大型分布式系统的痛点，Zilliqa实现了分片(Sharding)技术。
另外，也有团队因为PBFT算法消息数过多、不适应大型分布式系统的痛点，放弃使用PBFT算法，而是通过法律来约束"节点作恶"的行为，比如IBM的Hyperledger Fabric。技术是发展的，适合的才是最好的。在实际工作中，建议根据场景的可信度来决定是否采用PBFT算法，是否改进和优化PBFT算法。

重点总结

1.PBFT算法是通过签名(或消息认证码MAC)来约束恶意节点的行为，同时采用三阶段协议，基于大多数原则达成共识的。另外，与口信消息型拜占庭问题之解(以及签名消息型拜占庭问题之解)不同的是，PBFT算法实现的是一系列值得共识，而不是单值的共识。
2.客户端通过等待f+1个相同响应消息超时来发现主节点可能在作恶，此时客户端会发送客户端请求给所有集群节点，从而触发可能的视图变更。与Raft算法在领导者期间服务不可用类似，在视图变更时，PBFT集群也是无法提供服务的。