由于毕设和Lab项目需要,最近在看《从paxos到zookeeper分布式一致性原理与实践》, 2和3PC算法流程,网上资料很多,就不赘述了。由于书中关于2PC和3PC的缺点的部分描述不容易让人理解,因此本文主要想讨论一下2和3PC存在哪些优缺点?为什么存在这些缺点? 以及该协议适应的场景。
2PC 二阶段提交
2PC其实就是先尝试执行事务再提交的策略,如果有一个参与者出现问题,则回滚尝试期间做的事务操作,从而保证分布式事务的原子性。
2PC的缺点:同步阻塞、单点问题、脑裂、过于保守
同步阻塞:
2PC的执行过程中,协调者和参与者节点都处于阻塞状态。即节点之间在等待对方的相应消息时,它将什么也做不了。特别是,当一个节点A在已经占有了某项公共资源的情况下,为了等待其他节点的响应而陷入阻塞状态时,当节点B尝试访问节点A占有的资源时,这个节点B也将连带陷入阻塞状态。因此会极大限制分布式系统的性能。单点问题:
2PC中只有一个协调者,若算法执行到第二阶段,协调者宕机了,则参与者会一直阻塞下去,虽然可以通过选举新的协调者,或者参与者超时释放资源停止阻塞状态,但不管哪种方法都需要花费时间,而这段期间,参与者会一直陷入阻塞。数据不一致:
若算法执行到第二阶段,协调者向所有参与者发送commit请求,由于网络异常,导致部分参与者没有收到该commit,而另一部分参与者正常commit,这就导致了数据不一致的出现。
还有一种情况,当执行到第二阶段&