ETCD基本原理

最新推荐文章于 2023-04-11 09:00:25 发布

程序员柒叔

最新推荐文章于 2023-04-11 09:00:25 发布

阅读量826

点赞数

分类专栏：工具使用文章标签： etcd java 服务器 raft 分布式一致性

本文链接：https://blog.csdn.net/evilstar2015/article/details/127648390

版权

工具使用专栏收录该内容

3 篇文章 0 订阅

订阅专栏

2020年8月27日

在研究DCache过程中，发现其计划使用ETCD作为RouterServer的分布式协调组件，所以顺便研究了一下，帮助大家了解ETCD的功能、用途以及重要原理。

1 简介

1.1 功能特性

ETCD是一种用于实现共享配置、服务发现的分布式一致性系统，具备如下功能特性：

GO语言实现的，K/V分布式一致性存储系统
提供HTTP API，支持POST/GET/DELETE操作
支持SSL客户端安全认证
支持KEY持有TTL属性
支持目录（树形）操作
支持多KEY的事务操作

1.2 架构说明

HTTP Server：用于处理客户端HTTP请求

Store：用于处理客户端大部分事务（读）

Raft：etcd的一致性协议，核心模块，数据新增或变更时调用Raft模块；

WAL：Write ahead Log，预写式日志，是etcd的持久化存储方式

Snapshot，是为了防止日志文件过多而进行的快照存储

Entry，是存储日志的具体内容。

1.3 用途

鉴于ETCD的上述特性，其可以应用于：配置中心、服务注册发现、选主、分布式锁、应用调度，分布式队列，等等场景中。

1.4 与zookeeper对比

与zookeeper对比，etcd在项目实现，一致性协议易理解性，运维，安全等多个维度上，都占据优势。

1、一致性协议

etcd使用raft协议，zk使用zab（类paxos协议），前者易于理解，方便工程实现。ZooKeeper的部署、维护、使用比较复杂，需要安装客户端。

2、多语言适配

etcd提供http+json，grpc接口，跨平台语言；zk则需要使用其专用客户端，且官方只提供了Java和C两种语言的接口。

3、访问安全方面

etcd支持https访问，zk在这方面缺失。

5、etcd读写性能

每个实例每秒支持一千次写操作。这个性能还是相当可观的。越多，由于数据同步涉及到网络延迟，会根据实际情况越来越慢，而读性能会随之变强，因为每个节点都能处理用户请求。

2 基本概念

2.1 超时时间

在Raft算法中有2种超时设置：

1、选举超时时间（electric timeout）

当follower超过此时间未收到leader的心跳消息，会先发起投票，选举Leader。

2、心跳超时时间（heartbeat timeout）

Leader定时(heartbeat timeout)向follower发送心跳消息，日志复制是随着心跳消息发送的。

2.2 term

新的leader时代，每发生一次leader选举，都会刷新term值+1。

2.3 角色

ETCD中存在3种角色

leader
follower
candidate

3 一致性算法 --Raft

分布式协调系统的一致性算法，主要体现在选举和日志复制的过程中。

3.1 选举过程

1、所有节点初始状态为 follower

2、当 follower 没有收到 Leader的心跳时，角色就转变为 candidate，更新term值；投票给自己，然后给其他 follower发vote请求；

如果此时集群里有其他 candidate，也发起了投票(vote)请求，则follwer的投票响应遵循“先到先得”原则，并且只能投票给一个candidate；也就是说谁的投票请求先到达 follower，谁就会获得该follower的投票；后到达的投票请求无法获得投票（即voteResponse中标识位为false）。
收到投票请求的节点会重置自己的选举超时时间，避免发起重复选举；

3、当candidate获得集群中半数以上的投票时，升级为Leader，开始日志复制。

4、当多个candidate收集到的票数相同，且commitIndex一致的情况下，会等待一个选举周期，进行下一次选举；