Docker Swarm原理大解密

Docker Swarm原理大解密

Docker Swarm是docker公司2014年出品的基于docker的集群管理调度工具,官方文档地址:https://docs.docker.com/swarm/overview/。Swarm能够把多台主机构建成一个docker的集群,用户可以只和swarm api操作来管理多个主机上的docker,再结合上Overlay的网络实现简单的容器调度和互访。

Docker Swarm在设计上遵从了可插拔的设计思想,安装集群只需要启动几个docker就可以完成,安装过程可以参考这里:http://www.tuicool.com/articles/UJJJFjU

总结下Swarm的特性:
1.工作节点的注册和发现
2.管理节点收集集群中所有的信息
3.管理节点支持HA
4.管理节点能感知集群的变化,在节点挂掉后重新调度上面的container
5.提供filter和scheduler的调度策略调度集群里的容器

下面,本文会从源码层面解密Swarm是如何实现上面的特性的。

首先上一张整体的架构图。
来自daocloud的架构图。
这里写图片描述
http://blog.daocloud.io/wp-content/uploads/2015/01/swarmarchitecture.jpg

工作节点的注册和发现

在工作节点启动时会在后端的kvstore上注册一个节点,路径是etcd://ip:2376/docker/swarm/nodeip,Worker会把当前集群的eth0
的ip注册上etcd,然后设置上一个ttl时间,比如3秒。然后启一个for循环每隔2秒(配置heartbeat)注册一次,这样,如果etcd上这个节点没了就说明这个worker已经挂了。

for {
        log.WithFields(log.Fields{"addr": addr, "discovery": dflag}).Infof("Registering on the discovery service every %s...", hb)
        if err := d.Register(addr); err != nil {
            log.Error(err)
        }
        time.Sleep(hb)
    }

Manager的leader会启动一个go router watch后端的kvstore上注册上来的ip,如果是新节点注册上来就把节点加入到manager的内存中,开始收集数据,如果是节点挂了就删除

discoveryCh, errCh := cluster.discovery.Watch(nil)
go cluster.monitorDiscovery(discoveryCh, errCh)
go cluster.monitorPendingEngines()


for {
        select {
        case entries := <-ch:
            added, removed := currentEntries.Diff(entries)
            currentEntries = entries

        // Remove engines first. `addEngine` will refuse to add an engine
        // if there's already an engine with the same ID.  If an engine
        // changes address, we have to first remove it then add it back.
            for _, entry := range removed {
                c.removeEngine(entry.String())
            }

            for _, entry := range added {
                c.addEngine(entry.String())
            }
        case err := <-errCh:
            log.Errorf("Discovery error: %v", err)
        }
    }

管理节点收集集群中所有的信息

管理节点会收集集群中所有主机的信息放到内存中。当一个主机加入到Swarm中时,首先会对节点上所有的信息都收集一把到内存中,然后会建立一个docker client长链接,通过event API获取这个主机上的更新。

加入主机时的代码,首先做主机的全同步,然后启动eventMonitor,监控主机上的event:

e.eventsMonitor = NewEventsMonitor(e.apiClient, e.handler)

// Fetch the engine labels.
if err := e.updateSpecs(); err != nil {
    return err
}

e.StartMonitorEvents()

// Force a state update before returning.
if err := e.RefreshContainers(true); err != nil {
    return err
}

if err := e.RefreshImages(); err != nil {
    return err
}

// Do not check error as older daemon doesn't support this call.
e.RefreshVolumes()
e.RefreshNetworks()

Event的Handler,会根据event的类别更新对应类型的数据。这里由于考虑docker event的兼容性有点长,我就只贴一段:

switch msg.Type {
case "network":
    e.refreshNetwork(msg.Actor.ID)
case "volume":
    e.refreshVolume(msg.Actor.ID)
case "image":
    e.RefreshImages()
case "container":
    action := msg.Action
    // healthcheck events are like 'health_status: unhealthy'
    if strings.HasPrefix(action, "health_status") {
        action = "health_status"
    }
    switch action {
    case "commit":
        // commit a container will generate a new image
        e.RefreshImages()
    case "die", "kill", "oom", "pause", "start", "restart", "stop", "unpause", "rename", "update", "health_status":
        e.refreshContainer(msg.ID, true)
    case "top", "resize", "export", "exec_create", "exec_start", "exec_detach", "attach", "detach", "extract-to-dir", "copy", "archive-path":
        // no action needed
    default:
        e.refreshContainer(msg.ID, false)

管理节点支持HA

同其他很多的分布式的项目一样,Docker Swarm也是利用了raft里选举算法做的HA,我们来看下它的实现。

首先创建好candidata和follower,顺便说下leader election的path是docker/swarm/leader

client := kvDiscovery.Store()
p := path.Join(kvDiscovery.Prefix(), leaderElectionPath)

candidate := leadership.NewCandidate(client, p, addr, leaderTTL)
follower := leadership.NewFollower(client, p)

然后启两个协程,一个进行选举,如果成功了则成为leader,一个监听选举成功的消息,如果监听到别的manager成为leader则把自己设置成candidate,如果API请求到candidate会proxy到真正的manager。

primary := api.NewPrimary(cluster, tlsConfig, &statusHandler{cluster, candidate, follower}, c.GlobalBool("debug"), c.Bool("cors"))
replica := api.NewReplica(primary, tlsConfig)

go func() {
    for {
        run(cluster, candidate, server, primary, replica)
        time.Sleep(defaultRecoverTime)
    }
}()

go func() {
    for {
        follow(follower, replica, addr)
        time.Sleep(defaultRecoverTime)
    }
}()

server.SetHandler(primary)

管理节点能感知集群的变化,在节点挂掉后重新调度上面的container

由于worker会loop往kvstore上发送消息,因此如果节点挂掉时manager能立刻感知到变化,并触发removeEngine的动作,把container重新调度到其他节点上就很容易做到了。

提供filter和scheduler的调度策略调度集群里的容器

其实有了所有集群里的所有节点的信息,调度容器就变得比较简单了。Swarm提供了Filter和scheduler来让用户定义调度的策略。

调度本质上是让用户可以定义Container分配到集群中的策略。
Filter指定了如果满足这样的条件的节点不会(会)被分配上。
Scheduler指定了满足Filter后的节点按照怎样的优先级排序,排在前面的会被有限分配上Container。

Filter和Scheduler的种类我就不赘述了,可以参考官方文档:https://docs.docker.com/swarm/scheduler/rescheduling/#rescheduling-policies (貌似最近又有了新的策略 rescheduler)

调度的代码如下:

accepted, err := filter.ApplyFilters(s.filters, config, nodes, soft)
if err != nil {
    return nil, err
}

if len(accepted) == 0 {
    return nil, errNoNodeAvailable
}

return s.strategy.RankAndSort(config, accepted)

在使用Docker Swarm的时候大家其实可以发现,Swarm的设计还是有一些缺陷的,这会导致Swarm的一些局限性,比如:

1.worker的行为过于简单。只是往kvstore上同步状态,就启动一个Container,不做任何实际的工作,把所有活都交给Manager干,颇为浪费。
2.由于worker”啥也不干“,Manager必须保持所有节点的tcp长链接,扩展性很差。
3.没有加入副本控制。

总结下,Swarm作为一代的Docker调度工具提供了基本的调度能力,可以满足一些内部的CI/CD系统使用,但是由于扩展性较差和没有副本控制,不能直接拿来部署线上系统,这是有的遗憾的。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
### 回答1: Docker Swarm 是 Docker 官方提供的容器编排工具,可以用于管理多个 Docker 容器的集群。Nginx 是一款高性能的 Web 服务器和反向代理服务器,可以用于部署 Web 应用和负载均衡等场景。在 Docker Swarm 中,可以通过部署多个 Nginx 容器来实现 Nginx 集群的部署。 具体步骤如下: 1. 准备 Docker Swarm 环境,包括 Docker Engine 和 Docker Swarm。 2. 创建一个 Docker Swarm 集群,可以使用 docker swarm init 命令初始化一个 Swarm 集群。 3. 创建一个 Nginx 镜像,可以使用 Dockerfile 文件构建一个 Nginx 镜像,或者使用已有的 Nginx 镜像。 4. 创建一个 Docker Stack,可以使用 docker stack deploy 命令创建一个 Stack,其中包含多个 Nginx 服务。 5. 配置 Nginx 服务,可以使用 Docker Compose 文件配置 Nginx 服务,包括端口映射、负载均衡等。 6. 启动 Nginx 服务,可以使用 docker stack deploy 命令启动 Nginx 服务。 7. 验证 Nginx 集群是否正常工作,可以使用 curl 命令访问 Nginx 服务,或者使用浏览器访问 Nginx 服务。 以上就是使用 Docker Swarm 部署 Nginx 集群的基本步骤。 ### 回答2: Docker Swarm是Docker官方推出的一个容器编排工具,可以用于管理多个Docker节点组成的集群,实现容器的自动部署、扩展、升级等功能。Nginx是一款高性能的Web服务器软件,可以用于反向代理、负载均衡、静态文件缓存等应用场景,常用于构建Web服务集群。下面将介绍如何使用Docker Swarm部署Nginx集群。 1. 环境准备 首先需要在多台计算机上安装DockerDocker Swarm,可以参考官方文档进行安装。安装完成后,需要将多台计算机加入到一个Docker Swarm集群中,可以使用Docker Swarm的初始化命令和加入命令完成。在集群中选择一台作为Swarm Manager,其他节点作为Swarm Worker。 2. 创建Docker镜像 在部署Nginx集群之前,需要先创建Nginx的Docker镜像。可以使用Dockerfile构建镜像,或者使用Docker Hub上已有的Nginx镜像。在这里使用已有的Nginx镜像,并根据自己的要求修改Nginx的配置文件。 3. 创建Docker服务 创建Nginx的Docker服务,需要指定镜像名称、服务名称、副本数量、端口映射、挂载目录等参数。在创建服务时可以指定网络,此处需要创建一个Overlay网络,用于集群内部容器间通信。创建完成后,Docker Swarm会自动将服务的副本运行在集群内部的Worker节点上。 4. 部署Nginx集群 在集群内部创建多个Nginx服务,然后利用Docker Swarm的负载均衡功能将请求分发到不同的Nginx容器上。可以使用nginx.conf文件配置负载均衡策略,例如轮询、IP哈希等。在访问Nginx服务时,只需要访问Swarm Manager节点的VIP地址即可,Swarm会自动将请求分发到不同的Nginx容器上。 总结 Docker Swarm是一个强大的容器编排工具,可以用于管理复杂的容器集群。通过使用Docker Swarm,可以轻松地部署Nginx集群,提高Web服务的可用性和性能,实现高可用、高扩展性的服务架构。 ### 回答3: Docker是现今最为流行的容器化平台,其可以帮助我们将应用程序和其依赖项一起打包在一个可移植容器中。而Docker Swarm是Docker的官方集群管理工具,它允许我们快速轻松地构建、管理和扩展Docker容器集群。下面将介绍如何在Docker Swarm上部署nginx集群。 步骤一:创建Docker Swarm集群 首先,需要在集群中创建几个节点。在某台用作管理节点的机器上运行以下命令,在该机器上创建一个Swarm: ``` docker swarm init ``` 运行上述命令后,系统会返回一个命令,该命令需要您在其他节点上运行以加入集群。 步骤二:建立nginx镜像 接下来,需要创建一个基于Nginx的Docker镜像,并将其上传到Docker Hub。 ``` FROM nginx COPY nginx.conf /etc/nginx/nginx.conf CMD ["nginx", "-g", "daemon off;"] ``` 步骤三:使用docker stack 部署nginx集群 现在,启动一个名为“web”的服务,该服务由两个副本组成,并使用刚刚创建的Nginx镜像。 ``` docker service create -p 8080:80 --name web --replicas 2 nginx ``` 上述命令将在Docker Swarm集群中启动名为“web”的服务。使用标志“-p”将本地端口8080映射到容器的80端口。使用标志“--replicas”指定了启动两个副本。此命令将指定Nginx映像部署到Swarm中。 步骤四:查看nginx集群运行状态 在集群运行过程中,可以使用以下命令查看服务和副本的状态: ``` docker service ls ``` 此外,执行以下命令可以查看服务的状态和详细信息: ``` docker service ps web ``` 此命令将返回当前正在运行的服务副本的详细信息。通过查看这些信息,可以查看每个副本的IP地址和状态。 步骤五:测试nginx集群的负载均衡 现在,该nginx集群已成功部署。您可以使用“curl”命令或浏览器将请求发送到集群的任何成员。每次请求将自动转发到由Swarm管理的每个副本中的一个。 在浏览器中输入http://localhost:8080,您将看到nginx的欢迎页面,并可以看到每个请求都将定向到不同的副本。 总结 在Docker Swarm上部署nginx集群,可以快速轻松地运行一个高可靠性、高可用性的Web应用程序。使用Docker Swarm,我们可以轻松地扩展集群,通过使用负载均衡技术将请求自动转发到不同的副本。同时,Docker Swarm还提供了集群管理的所有功能,包括自动部署、升级和维护等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MrTitan

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值