golang入门笔记—etcd

小张同学该努力了

已于 2024-03-08 11:00:40 修改

阅读量3.6k

点赞数 2

分类专栏： golang 文章标签： golang

于 2022-04-15 00:45:41 首次发布

本文链接：https://blog.csdn.net/qq_43716830/article/details/124180951

版权

golang 专栏收录该内容

53 篇文章 26 订阅

订阅专栏

文章目录

etcd介绍：
etcd的核心架构：
etcd的简单使用：
以静态方式启动etcd集群：
以动态发现启动etcd集群：
面试题

etcd介绍：

etcd是使用Go语言开发的一个开源的、高可用的分布式key—value存储系统，可以用于配置共享和服务的注册和发现，基于raft算法实现具有强一致性

etcd中涉及了数据一致性、多版本并发控制、watch监控、磁盘IO读写等知识点

etcd的特性：

1.简单：etcd的安装简单，为用户提供了HTTP的接口，使用也很简单
2.存储：etcd的基本功能，基本信息存储在文件中
3.Watch机制：watch指定的键的更改会通知
4.安全通信：SSL证书验证
5.高性能：2K/s读操作，提供了基准测试的工具
6.一致可靠：raft一致性算法

类似的项目有zookeeper和consul。
etcd具有以下的特点：

1.完全复制：集群中的每个节点都可以使用完整的存档
2.高可用性：Etcd可用于避免硬件的单点故障或网络问题
3.一致性：每次读取都会返回跨多主机的最新写入
4.简单：包括一个定义良好、面向用户的API（gRPC）
5.安全：实现了带有可选的客户端证书身份验证的自动化TLS
6.快速：每秒10000次写入的基准速度
7.可靠：使用Raft算法实现了强一致、高可用的服务存储目录

etcd的常见分布式场景：

1.键值对存储
2.服务注册与发现
3.消息订阅与发布
4.分布式锁

CAP原理：

Consistency（一致性）：该项强调数据的正确性。具体而言，每次读操作，要么读到最新，要么读失败。这要求整个
分布式系统像是一个不可拆分的整体，写操作作用于集群像作用于单机一样，具有广义的“原子性”。
Availability（可用性）：该项站在使用者的角度，强调使用服务的体验。客户端的请求能够得到响应，不发生错误，
也不能出现过长的等待时间.
Partition tolerance（区间容错性）：分区容错性强调的是，在网络环境不可靠的背景下，整个系统仍然是正常运作
的，不至于出现系统崩溃或者秩序混乱的局面

CP:强调系统数据的正确性，但由于保证不同节点间严格一致性的机制，可能会牺牲系统的可用性
AP:强调系统的可用性，那就必须在数据一致性上做出妥协退让

分布式系统中，C 和 A 之间的矛盾正是在于网络环境的不稳定

etcd的核心架构：

在这里插入图片描述

etcd Server：用于对外接收和处理客户端的请求
gRPC Server：etcd与其他etcd节点之间的通信和信息同步
MVCC：多版本控制，etcd的存储模块。键值对的每一次操作行为都会被记录存储。这些数据底层存储在BoltDB数据库中。
在这里插入图片描述
Client层：Client层包括client v2和v3两大版本API客户端库，提供了简洁易用的API，同时支持负载均衡、节点间故障自动转移，可极大降低业务使用etcd复杂度，提升开发效率、服务可用性

API网络层：API网络层主要包括client访问server和server节点之间的通信协议。一方面，client访问etcd server的API分为v2和v3两个大版本。v2 API使用HTTP/1.x协议，v3 API使用gRPC协议。同时v3通过etcd grpc-gateway组件也支持HTTP/1.x协议，便于各种语言的服务调用。另一方面，server之间通信协议，是指节点间通过Raft算法实际数据复制和Leader选举等功能时使用的HTTP协议。

Raft算法层：Raft算法层实现了Leader选举、日志复制、ReadIndex等核心算法特性，用于保障多个etcd多个节点间的数据一致性、提升服务可用性等，是etcd的基石和亮点。

KVServer：鉴权和限流

Quota：写入时进行空间验证

WAL:存放预写式日志、最大的作用是记录整个数据变化的全部历程、在etcd中，所有数据的修改在提交前都要先写入到WAL中

SNAP：存放快照数据，存储etcd的数据状态。etcd防止WAL文件过多而设置的快照。

功能逻辑层：etcd核心特性实现层，如典型的KVServer模块、MVCC模块、Auth鉴权模块、Lease租约模块、Compactor压缩模块等，其中MVCC模块主要由treeIndex模块和boltdb模块组成。

存储层：存储层包含预写日志（WAL）模块、快照（Snapshot）模块、boltdb模块。其中WAL可保障etcd crash后数据不丢失，boltdb则保存了集群元数据和用户写入的数据。

服务注册发现：
在这里插入图片描述

应用在启动的时候主动从etcd获取一次配置信息，同时，在etcd节点上注册一个Watcher并等待，以后每次配置有更新的时候，etcd都会实时通知订阅者，以此达到获取最新配置信息的目的。

分布式锁：
因为etcd使用Raft算法保持了数据的强一致性，某次操作存储到集群中的值必然是全局一致的，所以很容易实现分布式锁。锁服务有两种使用方式，一是保持独占，二是控制时序。
1.保持独占即所有获取锁的用户最终只有一个可以得到。etcd为此提供了一套实现分布式锁原子操作CAS的API。通过设置prevExist值，可以保证在多个节点同时去创建某个目录时，只有一个是成功。而创建成功的用户就可以认为是获得了锁。
2.控制时序，即所有想要得到锁的用户会被安排执行，但是获得锁的顺序也是全局唯一的，同时决定了执行顺序。etcd为此也提供了一套API（自动创建有序键），对一个目录键值时指定为POST动作，这样etcd会自动在目录下生成一个当前最大的值为键，存储这个新的值（客户端编号）。同时还可以使用API顺序列出所有当前目录下的键值。此时这些键值的值就是客户端的时序，而这些键中存储的值可以是代表客户端的编号。

etcd架构：
在这里插入图片描述

etcd的简单使用：

etcd常用命令

put

etcdctl--endpoints=http://127.0.0.1:2379 put zyj"dsb"
//endpoints指定连接哪一台etcd，put要设置值

get

etcdctl--endpoints=http://127.0.0.1:2379 get zyj

#PUT设置或者更新某个键的值
etcdctl put /test/name fox

#GET获取指定键的值
etcdctl get /test/name
#以16进制格式返回
etcdctl get /test/name --hex
#获取key范围内的值半开区间: 左闭右开
etcdctl get /test/name /test/name3
#获取指定前缀的值 可以使用选项 --limit 限制返回的key数量
etcdctl get --prefix /test
etcdctl get --prefix /test --limit 3
# 按key的字典顺序读取
#读取字典顺序大于或等于 name2 的key:
etcdctl get --from-key name2
#etcd可通过读取一个key来获取当前etcd服务端的版本号，不管key是否存在
etcdctl get /name -w=json
#访问以前版本的key
#cluster_id: 请求的etcd集群ID。
#member_id: 请求的etcd节点ID。
#revision: etcd服务端当前全局数据版本号。对任一key的put或delete操作都会使revision自增1。revision=1是etcd的保留版本号，因此用户的key版本号将从2开始raft term: etcd当前raft主节点任期号。
#create_revision: 当前key创建时全局数据版本号revision的值。
#mod_revision: 当前key最后一次修改时全局数据版本号revision的值。
#version: 当前key的数据版本号。key创建时version为1，对当前key进行put操作会使version自增1，将key删除后，重新创建，version又会从1开始计数
etcdctl get --rev=8 /test/name #访问第8个版本的key

#删除 --prev-kv返回删除的键值
etcdctl del /name3 --prev-kv 

#watch检测一个键值的变化，一旦键值发生更新，就会输出最新的值并退出
etcdctl watch /test/name

#租约，类似于redis的TTL，etcd中的键值对可以绑定到租约上，实现存活周期控制。
#应用客户端可以为etcd集群里面的键授予租约，一旦租约TTL到期，租约就会过期并且所有附带的键都将被删除
#授权租约TTL为30s，返回一个租约的时间信息705bafafgasg 
etcdctl lease grant 30
#附加键到租约
etcdctl put --lease=705bafafgasg name fox
#撤销租约，将删除所有附带的key
etcdctl lease revoke 705bafafgasg 
#查看租约是否存活
etcdctl lease keep-alive 705bafafgasg 
#查询租约
etcdctl lease timetolive 705b84afaa8asfs0

权限管理：


#创建用户
etcdctl user add fox
#删除用户
etcdctl user del fox
#修改密码
etcdctl user passwd fox
#查看所有用户
etcdctl user list

#创建角色
etcdctl role add test
#给角色赋予权限[read|write|readwrite]
etcdctl role grant-permission test2 readwrite /name
#回收校色权限
etcdcctl role revoke-permission role_name /name
#给用户关联角色
etcdctl user grant-role fox test2

#查看指定用户及绑定角色
etcdctl user get fox

#开启权限认证
etcdctl auth enable

#以某个用户进行操作
etcdctl put /name fox --user=root

etcd启动命令的其它参数：

1.--name：给etcd取的名字
2.--listen-client-urls：客户端通信的url
3.--advertise-client-urls：建议使用的客户端通信的url
4.--listen-peer-urls：监听用于节点通信的url
5.--inital-advertise-peer-urls：建议用于节点通信的url
6.--inital-cluster-token：节点的token的值，集群生成唯一id
7.--inital-cluster：集群当中所有inital-advertise-peer合集
8.--inital-cluster-state:集群的状态信息

在这里插入图片描述

etcd读写请求执行流程

读过程：
在这里插入图片描述

客户端：
1.首先，etcdctl会对命令中的参数进行解析。

“get”是请求的方法，它是 KVServer 模块的 API；
“hello”是我们查询的 key 名；
“endpoints”是我们后端的 etcd 地址。

2.在解析完请求中的参数后，etcdctl会创建一个clientv3库对象，按照负载均衡策略选取一个合适的etcd节点，接着调用 KVServer 模块对应的 RPC 接口，发起 Range 请求的 gRPC 远程调用；

etcd clientv3库采用的负载均衡算法为Round-robin。针对每一个请求，Round-robin算法通过轮询的方式依次从
endpoint列表中选择一个endpoint访问，使etcd server负责尽量均衡

3.gRPC Server上注册的拦截器拦截到Range请求后，实现 Metrics 统计、日志记录等功能；

etcd 通过拦截器以非侵入式的方式实现了许多特性，例如: 丰富的 metrics、日志、请求行为检查所有请求的执行耗时及错误码、来源 IP、限流、验证等。拦截器提供了在执行一个请求前后的 hook 能力，除了debug 日志、metrics 统计、对 etcd Learner 节点请求接口和参数限制等能力，etcd 还基于它实现了以下特性：

1.要求执行一个操作前集群必须有 Leader;
2.请求延时超过指定阈值的，打印包含来源IP 的慢查询日志(3.5 版本)。

server 收到 client 的 Range RPC 请求后，根据 ServiceName 和 RPC Method 将请求转发到对应的handler 实现，handler 首先会将上面描述的一系列拦截器串联成一个拦截器再执行，在拦截器逻辑中，通过调用 KVServer 模块的 Range 接口获取数据和对数据进行校验和监控。

4.串行读与线性读：etcd为了保证服务高可用，生产环境一般部署多个节点，多节点之间的数据由于延迟等关系可能会存在不一致的情况。

在多节点etcd集群中，各个节点的状态机数据一致性存在差异。而我们不同业务场景的读请求对数据是否最新的容忍度是不一样的，有的场景它可以容忍数据落后几秒甚至几分钟，有的场景要求必须读到反映集群共识的最新数据。根据业务场景对数据一致性差异的接受程度，etcd 中有两种读模式。

1)串行(Serializable)读: 直接读状态机数据返回、无需通过 Raft 协议与集群进行交互，它具有低延时、高吞吐量的特
点，适合对数据一致性要求不高的场景。
2)线性读ReadIndex: etcd默认读模式是线性读，需要经过 Raft 协议模块，反应的是集群共识，因此在延时和吞吐量
上相比串行读略差一点，适用于对数据一致性要求高的场景(读一个地址可能会重定向到另外一个地址)
	当收到一个线性读请求时，它首先会从Leader获取集群最新的已提交的日志索引
	Leader收到ReadIndex请求时，为防止脑裂等异常场景，会向Follower节点发送心跳确认，一半以上节点确认
	Leader身份后才能将已提交的索引(committed index)返回给节点被请求的节点
	节点则会等待，直到状态机已应用索引(applied index)大于等于Leader的已提交索引时，然后去通知读请求，数据
	已赶上Leader，你可以去状态机中访问数据了

5.接着就是调用 MVCC 模块，根据 treeIndex 模块 B-tree 快速查找 key 对应的版本号
6.通过获取的版本号作为 key，查询存储在 boltdb 中的键值对；

写流程：
1.首先，etcdctl会对命令中的参数进行解析。

2.在解析完请求中的参数后，etcdctl会创建一个clientv3库对象，选取一个合适的etcd节点，接着调用 KVServer 模块对应的 RPC 接口，发起 Range 请求的 gRPC 远程调用；

3.etcd Server收到客户端请求，经过gRPC拦截、Quota校检、日志写入，Quota 模块用于校验 etcd db 文件大小是否超过了配额；

4.接着 KVServer 模块将请求发送给本模块中的 raft，这里负责与 etcd raft 模块进行通信，发起一个提案，命令为 put foo bar，即使用 put 方法将 foo 更新为 bar；

5.提案经过转发之后，半数节点成功持久化

当client发起一个写请求后分为以下几个步骤：

1.Leader收到写请求，它会将此请求持久化到WAL日志，并广播给各个节点
2.若一半以上的节点持久化成功，则该请求对应的日志条目被标记为已提交
3.etcdserver模块异步从Raft模块获取已提交的日志条目，应用到状态机（boltdb等）

6.MVCC 模块更新状态机

MVCC

MVCC是为了解决etcd v2不支持保存key的历史版本、不支持保存key的历史版本、不支持多key事务等问题而产生的。它核心是由内存树型索引模块和嵌入式的KV持久化存储数据库boltdb组成。boltdb是个基于B+tree实现的key-value键值库，支持事务，提供Get/Put等简易API给etcd操作。

etcd MVCC具体方案如下：

1.每次修改操作，生成一个新的版本号，以版本号为key，value为用户key-value等信息组成的结构体存储到blotdb。
2.读取时先从treeIndex中获取key的版本号，再以版本号作为boltdb的key，从boltdb中获取其value信息

在这里插入图片描述
6.boltdb
若 buffer 未命中，此时就真正需要向 boltdb 模块查询数据了。boltdb 使用 B+ tree 来组织用户的 key-value 数据，获取 bucket key 对象后，通过 boltdb 的游标 Cursor 可快速在 B+ tree 找到 key hello 对应的 value 数据，返回给 client。

etcd的持久化

etcd目前支持V2和V3两个大版本，这两个版本在实现上有比较大的不同，一方面是对外提供接口的方式，另一方面就是底层的存储引擎，V2版本的实例是一个纯内存的实现，所有的数据都没有存储在磁盘上，而V3版本的实例就支持了数据的持久化。

数据所在的目录，会被分为两个文件夹中，分别为snap和wal目录：

snap：

1.存放快照数据，存储etcd的数据状态
2.etcd防止WAL文件过多而设置的快照

wal：

1.存放预写式日志
2.最大的作用是记录了整个数据变化的全部历程
3.在etcd中，所有数据的修改在提交前都要先写入到WAL中

使用 WAL 进行数据的存储使得 etcd 拥有两个重要功能，那就是故障快速恢复和数据回滚/重做。

故障快速恢复就是当你的数据遭到破坏时，就可以通过执行所有 WAL 中记录的修改操作，快速从最原始的数据恢复
到数据损坏前的状态。
数据回滚重做就是因为所有的修改操作都被记录在 WAL 中，需要回滚或重做，只需要方向或正向执行日志中的操作
即可。

随着使用量的增加，WAL 存储的数据会暴增。为了防止磁盘很快就爆满，etcd 默认每 10000 条记录做一次 snapshot 操作，经过 snapshot 以后的 WAL 文件就可以删除。而通过 API 可以查询的历史 etcd 操作默认为 1000 条。

golang操作etcd

etcd库包的安装

go get go.etcd.io/etcd/clientv3

etcd的简单实例：

put和get操作

package main

import (
	"context"
	"fmt"
	"time"

	"go.etcd.io/etcd/clientv3"
)

func main() {
	cli, err := clientv3.New(clientv3.Config{
		Endpoints:   []string{"127.0.0.1:2379"}, //节点
		DialTimeout: 5 * time.Second,            //超过5秒钟连不上超时
	})
	if err != nil {
		fmt.Println("connect to etcd failed:", err)
		return
	}
	fmt.Println("connect to etcd success")
	defer cli.Close()
	ctx, cancel := context.WithTimeout(context.Background(), time.Second)
	_, err = cli.Put(ctx, "zyj", "dsb")
	cancel()
	if err != nil {
		fmt.Println("put to etcd failed,err:", err)
		return
	}
	ctx, cancel = context.WithTimeout(context.Background(), time.Second)
	resp, err := cli.Get(ctx, "zyj") //resp是相应对象
	cancel()
	if err != nil {
		fmt.Println("get from etcd failed:", err)
		return
	}
	for _, ev := range resp.Kvs { //Kvs是响应对象的多个键值对
		fmt.Printf("%s:%s\n", ev.Key, ev.Value)
	}
}

watch操作

package main

import (
	"context"
	"fmt"
	"time"

	"go.etcd.io/etcd/clientv3"
)

func main() {
	cli, err := clientv3.New(clientv3.Config{
		Endpoints:   []string{"127.0.0.1:2379"},
		DialTimeout: 5 * time.Second,
	})
	if err != nil {
		fmt.Println("connect to etcd success")
		return
	}
	fmt.Println("connect to etcd success")
	defer cli.Close()
	//派一个哨兵 一直监视着zyj的变化（新增，修改，删除）
	ch := cli.Watch(context.Background(), "zyj")
	//从通道中尝试取值（监视的信息）
	for wresp := range ch {
		for _, evt := range wresp.Events {
			fmt.Printf("Type:%v key:%v value:%v\n", evt.Type, string(evt.Kv.Key), evt.Kv.Value)
		}
	}
}

以静态方式启动etcd集群：

使用的工具为goreman

1.goreman的下载：

go install github.com/mattn/goreman
goreman help

2.编写local-cluster-profile文件

etcd1: etcd --name infra1 --listen-client-urls http://127.0.0.1:12379 --advertise-client-urls=http://127.0.0.1:12379 ……
etcd2: etcd --name infra2 --listen-client-urls http://127.0.0.1:22379 --advertise-client-urls=http://127.0.0.1:22379 ……
etcd3: etcd --name infra3 --listen-client-urls http://127.0.0.1:32379 --advertise-client-urls=http://127.0.0.1:32379 ……

3.使用goreman命令启动etcd集群

goreman -f local-cluster-profile start

4.访问任意一个etcd server获取集群member信息

etcdctl --endpoints=localhost:12379 member list

关闭某个节点：

goreman run stop etcd2

重启某个节点：

goreman run restart etcd2

5.向etcd集群写入数据

# 通过--endpoint参数来选择etcd2
etcdctl put user fox --endpoints http://localhost:22379

利用docker部署etcd集群命令：

docker network create --driver bridge --subnet=10.20.36.0/16 --gateway=10.20.1.1 mynet2

# node1
docker run -p 2379:2379 -p 2380:2380 --name etcd-node-1 \
  --volume=/var/lib/etcd:/etcd-data \
  quay.io/coreos/etcd:latest \
  /usr/local/bin/etcd \
  --data-dir=/etcd-data \
  --initial-advertise-peer-urls "http://10.20.30.1:2380" \
  --listen-peer-urls "http://0.0.0.0:2380" \
  --advertise-client-urls "http://10.20.30.1:2379" \
  --listen-client-urls "http://0.0.0.0:2379" \
  --initial-cluster "etcd-node-1=http://10.20.30.1:2380, etcd-node-2=http://10.20.30.2:2380, etcd-node-3=http://10.20.30.3:2380" \
  --initial-cluster-state "new" \
  --initial-cluster-token "my-etcd-token"

# node2
docker run -p 2379:2379 -p 2380:2380 --name etcd-node-2 \
  --volume=/var/lib/etcd:/etcd-data \
  quay.io/coreos/etcd:latest \
  /usr/local/bin/etcd \
  --data-dir=/etcd-data \
  --initial-advertise-peer-urls "http://10.20.30.2:2380" \
  --listen-peer-urls "http://0.0.0.0:2380" \
  --advertise-client-urls "http://10.20.30.2:2379" \
  --listen-client-urls "http://0.0.0.0:2379" \
  --initial-cluster "etcd-node-1=http://10.20.30.1:2380, etcd-node-2=http://10.20.30.2:2380, etcd-node-3=http://10.20.30.3:2380" \
  --initial-cluster-state "new" \
  --initial-cluster-token "my-etcd-token"

# node3
docker run -p 2379:2379 -p 2380:2380 --name etcd-node-3 \
  --volume=/var/lib/etcd:/etcd-data \
  quay.io/coreos/etcd:latest \
  /usr/local/bin/etcd \
  --data-dir=/etcd-data \
  --initial-advertise-peer-urls "http://10.20.30.3:2380" \
  --listen-peer-urls "http://0.0.0.0:2380" \
  --advertise-client-urls "http://10.20.30.3:2379" \
  --listen-client-urls "http://0.0.0.0:2379" \
  --initial-cluster "etcd-node-1=http://10.20.30.1:2380, etcd-node-2=http://10.20.30.2:2380, etcd-node-3=http://10.20.30.3:2380" \
  --initial-cluster-state "new" \
  --initial-cluster-token "my-etcd-token"

编写docker-compose.yml文件

version: "3.6"

services:
  node1:
    image: quay.io/coreos/etcd
    volumes:
      - node1-data:/etcd-data
    expose:
      - 2379
      - 2380
    networks:

    environment:
      - ETCDCTL_API=3
    command:
      - /usr/local/bin/etcd
      - --data-dir=/etcd-data
      - --name
      - node1
      - --initial-advertise-peer-urls
      - http://172.16.238.100:2380
      - --listen-peer-urls
      - http://0.0.0.0:2380
      - --advertise-client-urls
      - http://172.16.238.100:2379
      - --listen-client-urls
      - http://0.0.0.0:2379
      - --initial-cluster
      - node1=http://172.16.238.100:2380,node2=http://172.16.238.101:2380,node3=http://172.16.238.102:2380
      - --initial-cluster-state
      - new
      - --initial-cluster-token
      - docker-etcd

  node2:
    image: quay.io/coreos/etcd
    volumes:
      - node2-data:/etcd-data
    networks:
      cluster_net:
        ipv4_address: 172.16.238.101
    environment:
      - ETCDCTL_API=3
    expose:
      - 2379
      - 2380
    command:
      - /usr/local/bin/etcd
      - --data-dir=/etcd-data
      - --name
      - node2
      - --initial-advertise-peer-urls
      - http://172.16.238.101:2380
      - --listen-peer-urls
      - http://0.0.0.0:2380
      - --advertise-client-urls
      - http://172.16.238.101:2379
      - --listen-client-urls
      - http://0.0.0.0:2379
      - --initial-cluster
      - node1=http://172.16.238.100:2380,node2=http://172.16.238.101:2380,node3=http://172.16.238.102:2380
      - --initial-cluster-state
      - new
      - --initial-cluster-token
      - docker-etcd

  node3:
    image: quay.io/coreos/etcd
    volumes:
      - node3-data:/etcd-data
    networks:
      cluster_net:
        ipv4_address: 172.16.238.102
    environment:
      - ETCDCTL_API=3
    expose:
      - 2379
      - 2380
    command:
      - /usr/local/bin/etcd
      - --data-dir=/etcd-data
      - --name
      - node3
      - --initial-advertise-peer-urls
      - http://172.16.238.102:2380
      - --listen-peer-urls
      - http://0.0.0.0:2380
      - --advertise-client-urls
      - http://172.16.238.102:2379
      - --listen-client-urls
      - http://0.0.0.0:2379
      - --initial-cluster
      - node1=http://172.16.238.100:2380,node2=http://172.16.238.101:2380,node3=http://172.16.238.102:2380
      - --initial-cluster-state
      - new
      - --initial-cluster-token
      - docker-etcd

volumes:
  node1-data:
  node2-data:
  node3-data:

networks:
  cluster_net:
    driver: bridge
    ipam:
      driver: default
      config:
      -
        subnet: 172.16.238.0/24

以动态发现启动etcd集群：

discovery service：即服务发现，帮助新的etcd成员使用共享URL在集群引导阶段发现所有其他成员

所有新成员都与发现服务交互并帮助生成预期的成员列表

每个新成员使用此列表引导其服务器

该列表执行与–inital-cluster标志相同的功能
即设置所有集群的成员信息

实现机制：Discovery Service Protocol 可以帮助新的Etcd成员使用共享URL在集群引导阶段发现所有其他成员。该协议使用新的发现令牌来引导一个唯一的etcd集群，一个发现令牌只能代表一个etcd集群，只要此令牌上的发现协议启动，即使它中途失败，也不能用于引导另一个etcd集群。

操作步骤：

1.环境准备：所有节点均需要安装etcd

#创建etcd日志保存目录
mkdir -p /var/log/etcd
#创建单独的etcd数据目录
mkdir -p /data/etcd

2.创建集群发现：

#使用公共etcd发现服务，返回一个url地址
curl https://discovery.etcd.io/new?size=3
#生成的url
https://discovery.etcd.io/qr2yr2jhr23iu5r23refsf

size为集群节点数量，若未指定数量，则默认为3

3.启动集群
每个成员必须指定不同的名称标志，否则发现将因重复的名称而失败

etcd --name etcd1 --data-dir /data/etcd --initial-advertise-peer-urls http://192.168.65.206:2380 --listen-peer-urls http://192.168.65.206:2380 --listen-client-urls http://192.168.65.206:2379,http://127.0.0.1:2379 --advertise-client-urls http://192.168.65.206:2379 --discovery https://discovery.etcd.io/qr2yr2jhr23iu5r23refsf

在启动新的etcd时，加一个参数–advertise-client-urls就能发现加入集群中

4.集群检测

etcdctl member list

面试题

etcd和redis比较

etcd是一种分布式存储，强调的是各个节点之间的通信，同步，确保各个节点上数据和事务的一致性，使得服务发现
工作更稳定，本身单节点的写入能力并不强。etcd采用的是强一致性raft算法。

redis更像是内存型缓存，虽然也有cluster做主从同步和读写分离，但节点间的一致性主要强调的是数据，并不在乎事
务，因此读写能力很强，提供数据存储的类型也很多。redis是弱一致性，可能会丢失数据，或者读取不到最新数据。
redis的数据变化监听机制没有etcd完善

Raft中的一个任期是什么意思？

在Raft一致性算法中，Term（任期）是一个用于对事物进行顺序化的概念。每个任期都有一个唯一的正整数标识，用
于区分其他任期。Raft算法中的时间被分为一个个的任期，每个任期由一名领导者主导。

Raft 状态机是怎样切换的？

1.Leader选举：当一个Raft集群启动时，最开始没有Leader。集群中的每个节点都会发送选举请求(请求投票)来参与
	Leader选举。一个节点可以变为Candidate角色，并开始选举过程。
2.Candidate角色：Candidate角色执行以下几个步骤：
	a. 发起选举请求，并向其他节点请求投票。
	b. 如果收到大多数节点的投票赞成，则该Candidate节点成为新的Leader，并进入Leader角色。
	c. 如果在选举超时时间内没有获得足够的投票，会重新发起新一轮的选举。
3.Leader角色：一旦一个节点成为Leader，它会执行以下几个步骤：
	a. 接收来自客户端的日志操作请求，并将其复制到集群中的其他节点。
	b. 向其他节点发送心跳信号以保持其Leader地位。
	c. 在收到大多数节点响应的确认日志条目后，将其应用到自己的状态机，并向客户端返回响应。
4.Follower角色：在Leader选举过程中，未被选为Leader的节点会变为Follower角色。Follower角色执行以下几个主
要步骤：
	a. 接收来自Leader的心跳信号，以保持同步。
	b. 响应Leader的日志复制请求。
	c. 如果在选举超时时间内未收到来自Leader的心跳信号，该节点会变为Candidate角色，并重新参与Leader选举。

如何保证最短时间内竞选出 Leader，防止竞选冲突？

1.初始状态：系统中的每个节点都是候选者（Candidate）状态。
2.发起选举：当一个节点成为候选者后，它会增加当前任期号（term）并发起选举请求。同时，它会将自己的信息
（包括任期号、候选者ID等）广播给其他节点。
3.响应选举请求：其他节点收到选举请求后，首先检查请求中的任期号是否比自己的当前任期号大。如果是，则更新
自己的任期号为更大的值，清空投票给其他候选者的状态，并回复该请求。如果不是，则拒绝该请求。
4.支持候选者：节点在回复选举请求时，会将自己的投票给候选者，并重置选举超时定时器。

如何防止别的 Candidate 在遗漏部分数据的情况下发起投票成为 Leader？

1.预写日志在经过超过半数节点的回复后才会被提交
2.每个节点只会给日志比自己新的candidate投票
3.candidate只有在超过半数节点的投票后才可能成为leader

Raft 某个节点宕机后会如何？

1.首先，其他正常工作的节点会检测到宕机节点的心跳超时，将其标记为不可用。
2.集群中的 Leader 节点将会开始选举新的 Leader
3.新的 Leader 被选举后，它会通知其他节点，并开始复制日志。这确保了在宕机期间被认为是已提交的日志能够被
正确地复制到其他节点。
4.当宕机节点重新加入集群时，它会将自身的日志与 Leader 节点进行同步。Leader 会确定宕机节点的日志和自己的
日志之间的差异，并将缺失的日志发送给宕机节点。

为什么 Raft 算法在确定可用节点数量时不需要考虑拜占庭将军问题？

拜占庭将军问题是指在一个分布式系统中，存在有恶意的节点（拜占庭将军）向其他节点发送错误的或者虚假的信
息，从而干扰分布式系统的正常运行。

raft算法的设计目标之一是能够容忍一定数量的节点失效或变得不可信。具体来说，Raft算法要求集群中的大多数节
点是可用的，只有不能超过半数的节点失效或变得不可信。当超过半数节点失效或变得不可信时，Raft算法会进入暂	
停状态等待恢复。

如何判断写入是否成功？

1.客户端发送写入请求给Leader节点。
2.Leader节点将请求作为一个日志条目追加到自己的日志中，并发送AppendEntries RPC给其他节点，请求它们复制
该日志条目。
3.当Leader节点收到大多数节点的确认后，判定写入成功。
4.Leader节点将该日志条目应用到状态机，并将结果返回给客户端。

WAL具体的结构？
etcd的WAL（Write-Ahead Log）是一种持久化的日志记录方式，用于在节点发生故障等情况下保护数据的完整性。WAL是etcd的核心组件之一，用于记录集群中的所有写入操作。

WAL的具体结构如下：

1.日志条目（Entry）：WAL基于日志条目进行写入和恢复操作。每个日志条目由索引、任期号和具体数据组成。索
引用于唯一标识日志条目，任期号用于区分不同的任期，数据存储了具体的操作内容。
2.任期（Term）：集群中的每个任期会对应一个领导者（Leader），领导者负责接收客户端请求并将其复制到集群
中的其他节点。任期通过任期号进行标识。
3.快照（Snapshot）：WAL还可以通过快照来减少存储空间的使用。快照是etcd当前数据的一个副本，它只包含最新
的一次快照和其后的所有日志条目。

WAL的写入流程如下：

1.客户端发起写入请求
2.领导者接收请求，将操作转化为日志条目
3.领导者将日志条目写入WAL，同时将其复制给其他节点
4.其他节点接收并写入WAL，确认写入成功后返回响应给领导者
5.领导者将接收到的响应确认给客户端

WAL的恢复流程如下：

1.节点启动时加载WAL，并验证其中的日志条目
2.如果存在快照，将其应用到当前数据状态
3.根据WAL中的日志条目逐个应用到当前数据状态，保证数据的一致性

etcd进行服务注册与发现：

etcd 基于 Raft 算法，能够有力地保证分布式场景中的一致性。各个服务启动时注册到 etcd 上，同时为这些服务配置
键的 TTL 时间。注册到 etcd 上面的各个服务实例通过心跳的方式定期续租，实现服务实例的状态监控。

etcd作为服务注册发现的优势在于：
	1.简单易用，不需要集成sdk
	2.可配置性强

etcd的可配置性强体现在

1.数据模型的灵活性：etcd允许用户以键值对的形式存储和检索数据。用户可以自由定义键和值的内容，从而灵活地	
适应不同的业务需求。同时，etcd还支持复杂数据结构的存储，例如列表、映射等，使得数据模型更加丰富。

2.监听和触发机制：etcd支持监听特定键的变化，并通过回调函数触发相应的业务逻辑。这使得用户可以轻松地实现	
服务发现功能。当新的服务加入或退出时，etcd可以及时通知相关服务，使其动态更新服务列表。

3.ACL（访问控制列表）的支持：etcd支持针对不同用户和角色设置访问权限。用户可以通过ACL机制，灵活地控制	
对etcd集群中数据的读写权限。这保证了数据的安全性和可靠性。

4.多种API接口的支持：etcd提供了丰富的API接口，包括HTTP接口、gRPC接口、命令行接口等。用户可以根据自	
身的需求选择适合的接口进行操作，提高了使用的灵活性。