每个组织都有一个或多个主节点与排序节点进行连接,但是过多的节点与排序节点进行通讯无疑会占用过多的带宽。为了灵活利用带宽,Fabric 提供两种方式指定主节点:
- 静态指定:系统管理员可以自定义配置一个或多个节点作为该组织的主节点;
- 动态选举:节点可以通过选举选择一个节点作为主节点。
这两种方式都可以通过修改 core.yaml 的 useLeaderElection 和 orgLeader 字段值指定主节点选择方式。useLeaderElection 表示是否采用选择方式,orgLeader 表示该节点是否为主节点。因此,两个值均为 true 是非法的,而两个值为 false,则表明该节点为 stand-by 模式,即该节点将不会成为主节点。如果 useLeaderElection 为 false,则必须保证组织内至少有一个节点 orgLeader 值为 true。
1. 静态指定主节点
core.yaml 设置如下:
peer:
gossip:
useLeaderElection: false # 不进行动态选举主节点
orgLeader: true # 指定该节点为主节点
或者配置环境变量:
export CORE_PEER_GOSSIP_USELEADERELECTION=false
export CORE_PEER_GOSSIP_ORGLEADER=true
前面提到,如果指定某个节点不为主节点也是可以的:
peer:
gossip:
useLeaderElection: false # 不进行动态选举主节点
orgLeader: false # 指定该节点为非主节点
或者配置环境变量:
export CORE_PEER_GOSSIP_USELEADERELECTION=false
export CORE_PEER_GOSSIP_ORGLEADER=false
2. 动态选举主节点
动态选举配置信息:
peer:
gossip:
# Leader election service configuration
election:
# Longest time peer waits for stable membership during leader election startup (unit: second)
startupGracePeriod: 15s
# Interval gossip membership samples to check its stability (unit: second)
membershipSampleInterval: 1s
# Time passes since last declaration message before peer decides to perform leader election (unit: second)
leaderAliveThreshold: 10s
# Time between peer sends propose message and declares itself as a leader (sends declaration message) (unit: second)
leaderElectionDuration: 5s
Gossip 动态选举算法有如下特点:
- 节点的角色通过比较节点 ID 来确定
- 每个节点只有两种角色:主节点和从节点,当所有节点的共识一致的时候,就会产生一个主节点
- 如果网络被划分为多个分区,则每个分区都有一个主节点,当多个分区合并为一个分区的时候,则主节点的数量也应该只留下 1 个
- 节点之间的通信发送两种消息:
- proposal 消息:申请成为主节点
- declaration 消息:声明自己为主节点
每个节点都在后台持续运行:
- 如果主节点不存在,则进入主节点选举过程;
- 如果节点为主节点,则广播 declaration 消息,声明自己为主节点,如果收到别的节点发送的较低 节点 ID值,则成为从节点;
- 如果节点为从节点,并且在一定时间内(由 core.yaml 中的 leaderAliveThreshold 设置,默认 10 秒)没有收到其它节点发送的 declaration 消息,则设置主节点不存在。
主节点选举过程:
- 提交自己为主节点的提案;
- 收集其它节点发送的提案;
- 如果有其它节点声明为主节点,则放弃选举过程;
- 如果主节点不存在,则将自己的节点 ID 与其它节点的 ID 值进行比较,如果自己的 ID 值比其它任何一个节点 ID 值都小,则声明自己成为主节点,否则放弃选举过程。
详细过程图示:
主节点选举关键代码// ref: <https://github.com/hyperledger/fabric/blob/master/gossip/election/election.go>
func (le *leaderElectionSvcImpl) run() {
defer le.stopWG.Done()
for !le.shouldStop() {
if !le.isLeaderExists() {
le.leaderElection()
}
// If we are yielding and some leader has been elected,
// stop yielding
if le.isLeaderExists() && le.isYielding() {
le.stopYielding()
}
if le.shouldStop() {
return
}
if le.IsLeader() {
le.leader()
} else {
le.follower()
}
}
}
func (le *leaderElectionSvcImpl) leaderElection() {
le.logger.Debug(le.id, ": Entering")
defer le.logger.Debug(le.id, ": Exiting")
// If we're yielding to other peers, do not participate
// in leader election
if le.isYielding() {
return
}
// Propose ourselves as a leader
le.propose()
// Collect other proposals
le.waitForInterrupt(getLeaderElectionDuration())
// If someone declared itself as a leader, give up
// on trying to become a leader too
if le.isLeaderExists() {
le.logger.Info(le.id, ": Some peer is already a leader")
return
}
if le.isYielding() {
le.logger.Debug(le.id, ": Aborting leader election because yielding")
return
}
// Leader doesn't exist, let's see if there is a better candidate than us
// for being a leader
for _, o := range le.proposals.ToArray() {
id := o.(string)
if bytes.Compare(peerID(id), le.id) < 0 {
return
}
}
// If we got here, there is no one that proposed being a leader
// that's a better candidate than us.
le.beLeader()
atomic.StoreInt32(&le.leaderExists, int32(1))
}