一般来说,去中心化的算法具有以下特性。
- 相关信息分布在多台计算机上。
- 进程只根据本地信息做出决定。
- 不应该有一个单一的临界点,它的失败会导致算法的崩溃。
- 没有通用的时钟或其他准确的全球时间来源。
前三点都谈到了收集所有信息以在一个地方做出决定的不可接受性。在没有集中化的情况下提供同步需要与传统操作系统中使用的方法不同的方法。最后一点也很重要——在分布式系统中,按时达成一致绝非易事。从 UNIX make 程序的例子可以看出时间一致的重要性。主要的理论问题是缺少全局时钟和无法修复全局状态(分析情况 - 检测死锁,组织中间存储)。
时间同步
硬件时钟(而不是计时器 - 临时信号计数器和具有计数器初始值的寄存器)基于石英振荡器,并且在不同计算机中的频率可能会有所不同。
1978 年,Lamport 证明了时间同步是可能的,并提出了一种用于这种同步的算法。但是,他指出不需要绝对同步。如果两个进程不交互,那么它们不需要相同的时间。此外,在大多数情况下,约定的时间可能与广播中公布的天文时间没有任何关系。在这种情况下,可以说是逻辑时钟。
对于逻辑时钟同步,Lamport 定义了“发生在之前”的关系。表达式 a->b 读作“ a发生在b之前”,表示所有进程都同意事件“ a ”首先发生,然后是“ b ”。这种关系在两种情况下很明显:
- 如果两个事件发生在同一个进程中。
- 如果事件 a 是一个进程中的 SEND 操作,事件b是另一个进程收到此消息。
关系->是可传递的。
如果两个事件x 和 y 发生在不交换消息的不同进程中,则关系 x->y 和 y->x无效,这些事件称为同时发生。
让我们以这样的方式引入逻辑时间 C,如果a->b,则C(a) < C(b)
算法:
- 时钟 Ci 随着进程Pi中的每个事件递增:Ci=Ci+d ( d > 0, 通常为 1)
- 如果事件 a是进程Pi 发送消息m,则将时间戳tm=Ci(a)写入该消息。当进程 Pj收到此消息时 ,其时间调整如下: Cj = max(Cj,tm+d)
用一个例子来解释这个校正是如何进行的。