Kubernetes群集部署_kubernetes集群部署-CSDN博客

本文链接：https://blog.csdn.net/henanchenxuyuan/article/details/141321727

一、kubernetes介绍

Kubernetes 是谷歌以 Borg 为前身，基于谷歌 15 年的生产环境经验开源的一个项目。Kubernetes 是一个开源的，用于管理云平台中多个主机上的容器化的应用，Kubernetes 致力于提供跨主机集群的自动部署、扩展、高可用以及运行应用程序容器的平台，其遵循主从式架构设计.组件可以分为工作节点(Node)组件，和控制平面组件。Kubernetes Master 是集群的主要控制单元，用于管理工作负载并指导整个系统的通信。Kubernetes 控制平面由各自的进程组成，没个组件都可以在单个节点上运行，也可以在支持高可用集群的多个节点上运行。

1.1为什么需要Kubernetes

很多人会有疑问，有了 Docker 为什么还用 Kubernetes?
在业务开始进行容器化时，前期需要容器化的项目可能并不多，涉及的容器也并不多，此时基于 Docker 容器直接部署至宿主机也能实现基本的需求。但是随着项目越来越多，管理的容器也会越来越多，此时使用“裸容器”部署的方式管理起来就显得很吃力，并且随着业务量的增加，会明显体会到“裸容器”的不足。比如:

宿主机宕机造成该宿主机上的容器不可用，且无法自动恢复。
容器明明在运行，接口就是不通(健康检查做得不到位)
应用程序部署、回滚、扩缩容困难。
成百上千的容器和涉及的端口难以维护。

上面的问题知识做一个简单的罗列，真正使用时还有很多其他的问题。大家也可能使用过Docker-compose、Docker-swarm 等编排工具，但是这些工具的功能和 Kubernetes 比起来还是相差很多的。所以注定 Kubernetes 编排工具将成为主流的容器编排工具。

1.2对于开发人员

        由于公司业务多，开发环境、测试环境、预生产环境和生产环境都是隔离的，而且除了生产环境，为了节省成本，其他环境可能没有进行日志收集。在没有用 Kubernetes 的时候，查看线下测试的日志，需要开发者或测试人员找到对应的机器，再找到对应的容器，才能查看对应的日志。在使用 Kubernetes 之后，开发人员和测试者直接在 Kubernetes 的 Dashboard 上找到对应的namespace，即可定位到业务所在的容器，然后可以直接通过控制台查看到对应的日志，大大降低了操作时间。
        把应用部署到 Kubernetes 之后，代码的发布、回滚以及蓝绿发布、金丝雀发布等变得简单可控，不仅加快了业务代码的迭代速度，而且全程无须人工干预。生产环境可以使用jenkins、git等工具进行发版或回滚等。从开发环境到测试环境，完全遵守一次构建，多集群、多环境部署，通过不同的启动参数、不同的环境变量、不同的配置文件区分不同的环境。
        在使用服务网格后，开发人员在开发应用的过程中，无须去关心代码的网络部分，这些功能被服务网格实现，让开发人员可以只关心代码逻辑部分，即可轻松实现网络部分的功能，比如断流、分流、路由、负载均衡、限速和触发故障等功能。
        在测试过程中，可能同时存在多套环境，当然也会创建其他环境或临时环境，之前测试环境的创建需要找运维人员或者自行手工搭建。在迁移至 Kubernetes 集群后，开发人员如果需要新的环境，无须再找运维，只需要在 ienkins 上点点鼠标即可在 Kubernetes 集群上创建一套新的测试环境。

1.3对于运维人员

对于运维人员，可能经常因为一些重复、烦琐的工作感到厌倦，比如一个项目需要一套新的测试环境。另一个项目需要迁移测试环境至其他平台。传统架构可能需要装系统、装依赖环境、部署域名、开通权限等，这一套下来，不仅耗时，而且可能会因为有某些遗漏而造成诸多问题。而如今可以直接使用 Kubernetes 包管理工具，一键式部署一套新的测试环境，甚至全程无须自己干预,开发人员通过 jenkins 或者自动化运维平台即可一键式创建，大大降低了运维成本。

在传统架构体系下，公司业务故障可能是因为基础环境不一致、依赖不一致、端口冲突等问题,而现在使用 docker 镜像部署，Kubernetes 进行编排，所有的依赖、基础都是一样的，并且环境的自动化扩容、健康检査、容灾、恢复都是自动的，大大减少了因为这类基础问题引发的故障。另外,也有可能公司业务由于服务器宕机、网络等问题造成服务不可用，此类情况均需要运维人员及时去修复，而在 Kubernetes 中，可能在收到严重告警信息时，Kubernetes 已经自动恢复完成了。

在没有使用 Kubernetes 时，业务应用的扩容和缩容需要人工去处理，从采购服务器、上架到部署依赖环境，不仅需要大量的人力物力，而且非常容易在中间过程出现问题，又要花大量的时间去查找问题。成功上架后，还需要在前端负载均衡添加该服务器，而如今，可以利用 Kubernetes的弹性计算一键式扩容和缩容，不仅大大提高了运维效率，而且还节省了不少的服务器资源，提高了资源利用率。

在反向代理配置方面，可能对 nginx的配置规则并不熟悉，一些高级的功能也很难实现，但是在 Kubernetes 上，利用 Kubernetes 的 ingress 即可简单的实现那些复杂的逻辑，并且不会再遇到 nginx 少加一个斜杠和多加一个斜杠的问题。
在负载均衡方面，之前负载均衡可能是 nginx、LVS、Haproxy、F5 等，云上可能是云服务商提供的负载均衡机制。每次添加和删除节点时，都需要手动去配置前端负载均衡，手动去匹配后端节点。在使用 Kubernetes 进行编排服务时，使用 Kubernetes 内部的 Service 即可实现自动管理节点，并且支持自动扩容、缩容。

在高可用方面，Kubernetes 天生的高可用功能让运维人员彻底释放了双手，无需再去创建名类高可用工具，以及检测脚本。Kubernetes 支持进程、接口级别的健康检查，如果发现接口超时或者返回值不正确，会自动处理该问题。

在中间件搭建方面，根据定义好的资源文件，可以实现秒级搭建各类中间件高可用集群，且支持一键式扩容、缩容，如 Redis、RabbitMQ、Zookeeper 等，并且大大减少了出错的概率。

在应用端口方面，传统架构中，一台服务器可能跑了很多进程，每个进程都有一个端口，要认为的去配置端口，并且还需要考虑端口冲突的问题，如果有防火墙的话，还需要配置防火墙，在Kubernetes 中,端口统一管理、统一配置,每个应用的端口都可以设置成一样的,之后通过 Service进行负载均衡，大大降低了端口管理的复杂度和端口冲突。

无论是对于开发人员、测试人员还是运维人员，Kubernetes 的诞生不仅减少了工作的复杂度还减少了各种运维成本。

1.4Kubernetes 带来的挑战

Kubernetes 从诞生至今，一路突飞猛进，在容器编排的领域过关斩将，最终拿下了容器编排的冠军宝座，成为最无可替代、不可撼动的佼佼者，但是针对 Kubernetes 的学习和使用始终是一个很大的难题。
首先，Kubernetes 本身的学习就很困难，因为Kubernetes 概念太多，涉及的知识面也非常广泛，可能学习了一个月也无法入门，甚至连集群也搭建不出来，使人望而却步。并且 Kubernetes的技术能力要求也比较高，因为运维不仅仅均线于传统运维，有时候可能要修改业务代码、制定业务上线体系、给研发人员在开发应用中提供更好的建议等。需要掌握的知识也有很多，可能需要掌握公司内所有使用带的代码，比如代码如何进行编译、如何正确发布、如何修改代码配置文件等,这对于运维人员也是一种挑战。Kubernetes 的诞生把运维从传统的运维转变到了 DevOps 方向，需要面临的问题更多，需要面临的新技术也很多，但是当真正掌握 Kubernetes 的核心和涉及理念,就会收益终身。

二、Kubernetes架构解析

由图可知，Kubernetes 架构可以简单分为主(master)节点，从(worker/node)节点和数据库 ETCD。其中主节点为集群的控制单元，一般不会运行业务应用程序，主要包含的组件Kube-APIServer、Kube-ControllerManager、Kube-Scheduler。从节点为工作节点，也就是部署应用程序容器的节点，主要包含的组件有 Kubelet、Kube-Proxy、容器，当然如果 master 节点也要部署容器，也会包含这两个组件。
同时，可以看出一个集群中可以有多个 node 节点,用于保证集群容器的分布式部署，以保证业务的高可用性，也可以有很多的 master 节点，之后通过一个负载均衡保证集群控制节点的高可用。负载均衡可以使用软件负载均衡 Nginx、LVs、Haproxy+Keepalived 或者硬件负载均衡 F5 等，通过负载均衡对 Kube-APIServer 提供的 VIP 即可实现 master 节点的高可用，其他组件通过该 VIP连接至 Kube-APIServer。ETCD 集群可以和 master 节点部署在同一个宿主机，也可以单独部署。生产环境建议部署大于3的奇数台 ETCD 节点用于实现 ETCD 集群的高可用。etcd 的 Leader 选举和数据写入都需要半数以上的成员投票通过确认，因此，集群最好由奇数个成员组成，以确保集群内部一定能够产生多数投票通过的场景。这也就是为什么 etcd 集群至少需要 3 个以上的成员。

1.master节点的组件

master 节点是 Kubernetes 集群的控制节点,在生产环境中不建议部署集群核心组件外的任何容器(在 kubeadm 安装方式下，系统组件以容器方式运行在 master 节点的宿主机上;二进制安装方式下，系统组件以守护进程的方式运行，master节点可以不运行任何容器)，公司业务程序的容器是不建议部署在 master 节点上，以免升级或者维护时对业务在成影响。

(1)APl server

API server 提供了集群网关，是整个集群的控制中枢，提供集群中各个模块之间的数据交换并将集群信息存储到 ETCD 集群中。同时，它也是集群管理、资源配额、提供完备的集群安全机制的入口，为集群各类资源对象提供增删改査。API server 在客户端对集群进行访问，客户端需要通过认证，并使用 API server 作为访问节点和 pod (以及服务)的堡垒和代理/通道。

API 服务器公开 Kubernetes API。
REST/kubect1 的入口点--它是 Kubernetes 控制平面的前端。
它跟踪所有集群组件的状态并管理它们之间的交互。
它旨在水平扩展。
它使用 YAML/JSON manifest 文件。
它验证和处理通过 API 发出的请求。

(2)Scheduler

Scheduler 主要功能是资源调度，将 pod 调度到对应的主机上。依据请求资源的可用性、服务请求的质量等约束条件，K8s也支持用户自己提供的调度器。

它将 pod 调度到工作节点。
它监视 api-server 以查找没有分配节点的新创建的 Pod，并选择一个健康的节点让它们运行。
如果没有合适的节点，则Pod 将处于挂起状态，直到出现这样一个健康的节点。
它监视 API Server 的新工作任务。

(3)Controller Manager

Controller Manager 负责维护集群的状态，比如故障检测、内存垃圾回收、滚动更新等，也执行 API 业务逻辑:K8s 默认提供 replication controller、controller、daemonsetcontroller 等控制器。

它监视它管理的对象的期望状态并通过 API 服务器监视它们的当前状态。
采取纠正措施以确保当前状态与所需状态相同。
它是控制器的控制器。
它运行控制器进程。从逻辑上讲，每个控制器都是一个单独的进程，但为了降低复杂性，它们都被编译成一个二进制文件并在单个进程中运行。

(4)etcd

etcd 用于可靠的存储集群的配置数据，是一种持久性、轻量型、分布式的键值数据存储组件。可以理解为一种分布式的非关系型数据库。etcd 是集群的状态， K8s 默认使用分布式的 etcd 集群整体存储用来实现发现服务和共享配置集群的所有状态都存储在 etcd 实例中，并具有监控的能力，因此当 etcd 中的信息发生变化时，能够快速地通知集群中相关的组件。

它是一个一致的、分布式的、高度可用的键值存储。
它是有状态的持久存储，用于存储所有 Kubernetes 集群数据(集群状态和配置)。
它是集群的真相来源。
它可以是控制平面的一部分，也可以在外部进行配置。

etcd 集群最少3个节点，容错点才会有1个。3 个节点和4个节点的容错能力是一样的，所以有时候保持奇数节点更好，从这里可以判断出我们在部署 k8s 的时候，至少有3个节点，才保证 etcd 有1个节点容错性。

另外，etcd 的 Leader 选举和数据写入都需要半数以上的成员投票通过确认，因此，集群最好由奇数个成员组成，以确保集群内部一定能够产生多数投票通过的场景。所以 etcd 集群至少需要 3 个以上的奇数个成员。

偶数个节点集群不可用风险更高，表现在选主(Leader 选举)过程中，有较大概率的等额选票，从而触发下一轮选举。
偶数个节点集群在某些网络分割的场景下无法正常工作。当网络分割发生后，将集群节点对半分割开，形成脑裂。

2.Node节点包含的组件

Node 节点也被成为 worker 节点，是主要负责部署容器的主机，集群中的每个节点都必须具备容器的 Runtime(运行时)，比如 docker
kubelet 作为守护进程运行在 Node 节点上,负责监听该节点上所有的 pod，同时负责上报该节点上所有 pod 的运行状态，确保节点上的所有容器都能正常运行。当 Node 节点宕机或故障时，该节点上运行的 pod 会被自动转移到其他节点上。

(1)容器运行时

docker 引擎是本地的容器运行时环境，负责镜像管理以及 pod 和容器的真正运行。K8s 本身并不提供容器运行时环境，但提供了接口，可以插入所选择的容器运行时环境，目前支持 Docker 和rkt。

容器运行时是负责运行容器(在Pod 中)的软件。
为了运行容器，每个工作节点都有一个容器运行时引警。
它从容器镜像注册表(container image registry)中提取镜像并启动和停止容器

Kubernetes 支持多种容器运行时:

Docker
containerd
CRI-0
Kubernetes CRI(container Runtime Interface，容器运行时接口)的任何实现。

(2)kubelet

kubelet 是 node 节点上最主要的工作代理，用于汇报节点状态并负责维护 pod 的生命周期,也负责 volume(CVI)和网络(CNI)的管理。kubelet 是pod 和节点 API 的主要实现者，负责驱动容器执行层。作为基本的执行单元，pod 可以拥有多个容器和存储卷，能够方便地在每个容器中打包一个单一的应用，从而解耦了应用构建时和部署时所关心的事项，方便在物理机或虚拟机之间进行迁移。

它是在集群中的每个节点上运行的代理。
它充当 API 服务器和节点之间的管道。
它确保容器在 Pod 中运行并且它们是健康的,
它实例化并执行 Pod。
它监视 API Server 的工作任务。
它从主节点那里得到指令并报告给主节点。

(3)kube-proxy 代理

kube-proxy 代理对抽象的应用地址的访问，服务提供了一种访问一群 pod 的途径，kube-proxy 负责为服务提供集群内部的服务发现和应用的负载均衡(通常利用 iptables 规则)，实现服务到 pod 的路由和转发。此方式通过创建一个虚拟的 IP 来实现，客户端能够访问此 IP，并能够将服务透明地代理至 pod。

它是网络组件，在网络中起着至关重要的作用。
它管理 IP 转换和路由。
它是运行在集群中每个节点上的网络代理
它维护节点上的网络规则。这些网络规则允许从集群内部或外部与Pod 进行网络通信
它确保每个 Pod 获得唯一的 IP 地址。
这使得 pod 中的所有容器共享一个 IP 成为可能。
它促进了 Kubernetes 网络服务和服务中所有 pod 的负载平衡。
它处理单个主机子网并确保服务可供外部各方使用。

3. Kubernetes网络插件

CNI(容器网络接口)是一个云原生计算基金会项目，它包含了一些规范和库，用于编写在Linux 容器中配置网络接口的一系列插件。CNI 只关注容器的网络连接，并在容器被删除时移除所分配的资源。
Kubernetes 使用 CNI 作为网络提供商和 Kubernetes Pod 网络之间的接口。

(1)Flannel 网络

由 Coreosk 开发的一个项目，很多部署工具或者 k8s 的发行版都是默认安装，flannel 是可以用集群现有的 etcd，利用 api 方式存储自身状态信息，不需要专门的数据存储，是配置第三层的ipv4 0verlay 网络，在此网络内，每个节点一个子网，用于分配 ip 地址，配置 pod 时候，节点上的网桥接口会为每个新容器分配一个地址，同一主机中的 pod 可以使用网桥通信，不同主机的 pod流量封装在 udp 数据包中，路由到目的地。

Flanne1 通过每个节点上启动一个 flnnel 的进程，负责给每一个节点上的子网划分、将子网网段等信息保存至 etcd，具体的报文转发是后端实现，在启动时可以通过配置文件指定不同的后端进行通信，目前有 UDP、VXLAN、host-gatway 三种，VXLAN 是官方推荐，因为性能良好，不需人工干预。UDP、VXLAN 是基于三层网络即可实现，host-gatway 模式需要集群所有机器都在同一个广播域、就是需要在二层网络在同一个交换机下才能实现，host-gateway 用于对网络性能要求较高的常见，需要基础网络架构支持，UDP 用于测试或者不支持VXLAN 的 linux 内核。反正一般小规模集群是完全够用的，直到很多功能无法提供时在考虑其他插件。

(2)Calico 网络

虽然 fa1nne1 很好，但是 calico 因为其性能、灵活性都好而备受欢迎，calico 的功能更加全面，不但具有提供主机和 pod 间网络通信的功能，还有网络安全和管理的功能，而且在 CNI 框架之内封装了 calico 的功能，calico 还能与服务网络技术 Istio 集成，不但能够更加清楚的看到网络架构也能进行灵活的网络策略的配置，calico 不使用 overlay 网络，配置在第三层网络，使用 BGP路由协议在主机之间路由数据包，意味着不需要包装额外的封装层。主要点在网络策略配置这一点,可以提高安全性和网络环境的控制。
如果集群规模较大，选择 calico 没错，当然 calico 提供长期支持，对于一次配置长期使用的目的来说，是个很好的选择。

三、Kubeadm快速安装Kubernetes集群

1.本节实验环境

备注:
Kubernetes v1.23 支持高达 5008 节点。更准备地说，在使用 Kubernetes 时，应当遵循以下所有准则:

每个节点不要超过 110 个 Pod!
集群不要超过 5000 节点，
集群不要超过 150000 个 Pod,
不要超过 300000 个container.

2.实验要求

本节的实验要求:通过 Kubeadm 实现快速部署 Kubernetes 集群。

3.实现思路

本节实验的实现思路如下:
(1)部署三台主机的基础环境,
(2)部署三台主机的 Docker 环境。
(3)通过 Kubeadm 快速部署 Kubernetes 集群。

4.基础环境准备(此步骤在三个节点都执行)

正式开始部署 kubernetes 集群之前，先要进行如下准备工作。基础环境相关配置操作在三台主机k8s-master、k8s-node01、k8s-node02 上都需要执行，下面以 k8s-master 主机为例进行操作演示。

基础网络信息配置要求

依据案例环境为三台主机配置 IP 地址、网关、DNS 等基础信息，确保可连接互联网，推荐虚拟机使用 NAT 模式。k8s-master 主机最小配置为 2 核 2G，k8s-node 节点最小配置为 1 核 1G。

升级内核

rm -rf /etc/yum.repos.d/*
curl -0 /etc/yum.repos.d/centos-Base.repo https://mirrors.aliyun.com/repo/centos-7.repo
curl -o /etc/yum.repos.d/epel.repo https://mirrors.aliyun.com/repo/epe1-7.repo
yum clean all
yum -y update
yum -y upgrade
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-4.e17.elrepo.noarch.rpm
yum --enablerepo=elrepo-kernel install -y kernel-ml-devel kernel-ml
grub2-set-default 0
reboot

备注:如果使用自己的私有仓库，此步骤替换成如下操作

yum -y update
yum -y upgrade
yum --enablerepo=elrepo-kernel install -y kernel-ml-devel kernel-ml
grub2-set-default 0
reboot

5.部署 docker 环境(此步骤在三个节点都执行)

完成基础环境准备之后，在三台主机上分别部署 Docker 环境，因为 Kubernetes 对容器的编排需要 Docker 的支持。以 k8s-master 主机为例进行操作演示，首先安装一些 Docker 的依赖包,然后将 Docker 的 YUM 源设置成国内地址，最后通过 YUM 方式安装 Docker 并启动。

(1)关闭防火墙

systemctl stop firewalld
systemctl disable firewalld

(2)禁用 SELinux

sed -i/^SELINUX=/s/enforcing/disabled/'/etc/selinux/config
setenforce 0

(3)安装docker(用阿里的仓库安装)

sudo yum install -y yum-utils device-mapper-persistent-data lvm2
sudo yum-config-manager --add-repo https://mirrors.aliyun.com/dockerce/linux/centos/docker-ce.repo
sudo sed -i 's+download.docker.com+mirrors.aliyun.com/docker-ce+’ /etc/yum.repos.d/docker-ce.repo
sudo yum makecache fast
sudo yum -y install docker-ce
sudo service docker start

(4)配置加速器

很多镜像都是在国外的服务器上，由于网络上存在的问题，经常导致无法拉取镜像的错误，所以最好将镜像拉取地址设置成国内的。

mkdir -p /etc/docker
cat<<EOF>/etc/docker/daemon.json
{
registry-mirrors":["https://registry.docker-cn.com"],
"exec-opts":["native.cgroupdriver=systemd"]
}
EOF
systemctl daemon-reload
systemctl start docker
systemctl enable docker

备注:问题分析:
docker 的 cgroup 驱动程序默认设置为 cgroupfs。默认情况下 Kubernetes cgroup 驱动为systemd，我们需要更改 Docker cgroup 驱动。Kubernetes 的默认驱动和 docker 的驱动是一致的。因为多数 linux 发行版的 cgroup 的驱动为 systemd，所以当再选择 cgroupfs 作为驱动时，会致使操作系统中存在两个 cgroup 驱动，会带来不稳定的影响。所以在系统已经使用 systemd 的基础上，配置不推荐使用 cgroupfs，直接使用 systemd 即可。
修改方法:在 daemon.json 中添加"exec-opts":["native.cgroupdriver=systemd"]

cgroup 全称是 control groups
control groups:控制组，被整合在了 linux内核当中，把进程(tasks)放到组里面，对组设置权限，对进程进行控制。可以理解为用户和组的概念，用户会继承它所在组的权限。cgroups 是 1inux 内核中的机制，这种机制可以根据特定的行为把一系列的任务，子任务整合或者分离，按照资源划分的等级的不同，从而实现资源统一控制的框架，cgroup 可以控制、限制、隔离进程所需要的物理资源，包括cpu、内存、I0，为容器虚拟化提供了最基本的保证，是构建 docker系列虚拟化的管理工具

(5)设置内核参数

cat<<EOF>> /etc/sysctl.conf
net.ipv4.ip forward=1
net.bridge.bridge-nf-call-ip6tables=1
net.bridge.bridge-nf-call-iptables=1
EOF
sysctl -p

6.部署 Kubernetes 集群(注意命令执行的节点)

(1)配置三台主机的主机名

主机一

hostnamectl set-hostname k8s-master
bash

主机二

hostnamectl set-hostname k8s-node01
bash

主机三

hostnamectl set-hostname
bash

(2)在三台主机上绑定 hosts

cat<<EOF>>/etc/hosts
192.168.10.101 k8s-master
192.168.10.102 k8s-node01
192.168.10.103 k8s-node2
EOF

(3)关闭交换分区

swapoff -a
sed -i'/swap/s/^/#/' /etc/fstab

(4)在三台主机上安装常用软件

yum -y install vim wget net-tools lrzsz

备注:
如果已经安装过这些包，可以忽略此步

(5)配置 Kubernetes 的 YUM 源

操作节点:k8s-master,k8s-node01,k8s-node02

cat <<EOF>/etc/yum.repos.d/kubernetes.repo[kubernetes
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-e17-x86 64/enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpghttps://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
yum clean all

(6)安装 Kubelet、Kubeadm 和 Kubectl

操作节点:k8s-master，k8s-node01，k8s-node02

yum install -y kubelet-1.23.0 kubeadm-1.23.0 kubect1-1.23.0

如果在命令执行过程中出现索引 gpg 检査失败的情况，请使用 yum insta11 -y --nogpgcheckkubelet-1.23.0 kubeadm-1.23.0 kubect1-1.23.0来安装，或者将 gpgcheck=1 和repo_gpgcheck=1 设置为0

(7)Kubelet 设置开机启动

操作节点:k8s-master，k8s-node01，k8s-node02

systemctl enable kubelet

kubelet 刚安装完成后，通过 systemct1 start kubelet 方式是无法启动的，需要加入节点或初始化为 master 后才可启动成功。

(8)生成初始化配置文件

操作节点:k8s-master
Kubeadm提供了很多配置项，Kubeadm配置在 Kubernetes 集群中是存储在ConfigMap 中的，也可将这些配置写入配置文件，方便管理复杂的配置项。Kubeadm 配置内容是通过 kubeadm config 命令写入配置文件的。

生成初始化配置文件

kubeadm config print init-defaults >init-config.yaml

其中，kubeadm config 除了用于输出配置项到文件中，还提供了其他一些常用功能如下所示。

kubeadm config view:查看当前集群中的配置值。
kubeadm config print join-defaults:输出 kubeadm join 默认参数文件的内容
kubeadm config images list:列出所需的镜像列表,
kubeadm config images pu1l:拉取镜像到本地。
kubeadm config upload from-flags:由配置参数生成 ConfigMap。

(9)修改初始化配置文件

操作节点:k8s-master

vim init-config.yaml
apiVersion:kubeadm.k8s.io/v1beta3bootstrapTokens:
-groups:
-system:bootstrappers:kubeadm:default-node-tokentoken: abcdef.0123456789abcdef
ttl:24hames
usages :
- signing
-authentication
kind: Initconfiguration
localAPIEndpoint:
advertiseAddress:192.168.10.101bindPort:6443
nodeRegistration:
crisocket:/var/run/dockershim.sock
name:k8s-master
taints:null
---
apiserver:
timeoutForcontrolPlane:4mgs
apiVersion:kubeadm.k8s.io/v1beta2
certificatesDir:/etc/kubernetes/pkiclusterName:kubernetes
controllerManager:{}
dns :
type: CoreDNs
etcd:
local:
dataDir:/var/lib/etcdimageRepository:registry.aliyuncs.com/google_containerskind:clusterConfigurationkubernetesVersion:v1.23.0
networking:
dnsDomain:cluster.localserviceSubnet:10.96.0.0/12
podsubnet:10.244.0.0/16
scheduler:{}

注意:1.24.0的版本中 apiVersion:kubeadm.k8s,io/v1beta2 被弃用。

备注:
servicesubnet:指定使用 ipvs 网络进行通信,ipvs 称之为 IP 虛拟服务器(IP Virtual server简写为 IPVS)。是运行在 LVS 下的提供负载平衡功能的一种技术。含义 IPVS 基本上是一种高效的Layer-4 交换机
podsubnet 10.244.0.0/16 参数需要和后文中 kube-flanne1.yml 中的保持一致，否则，可能会使得 Node 间 cluster Ip 不通。
默认情况下,每个节点会从 Podsubnet 中注册一个掩码长度为 24 的子网,然后该节点的所有 podip 地址都会从该子网中分配。

(10)拉取所需镜像

操作节点:k8s-master

如果地址无法解析，可以使用阿里的公共 DNS:223.5.5.5或223.6.6.6

kubeadm config images list --config init-config.yaml
kubeadm config images pull --config=init-config.yaml

备注:
此步骤是拉取 k8s 所需的镜像，如果已经有离线镜像，可以直接导入，这一步就不需要了

(11)初始化 k8s-master

操作节点:k8s-master

注意:master节点最少需要2个CPU

kubeadm init --config=init-config.yaml

备注:
执行完该命令后一定记下最后生成的 token:kubeadm join 192.168.10.101:6443 --token abcdef.0123456789abcdef--discovery-token-ca-cert-hash

sha256:8b17b7d607ab7f79c2249c58d74525368bbb15ad884c365aaa1a968b9833d107

备注:
Kubeadm 通过初始化安装是不包括网络插件的，也就是说初始化之后是不具备相关网络功能的，比如 k8s-master 节点上査看节点信息都是“Not Ready”状态、Pod 的 CoreDNS 无法提供服务等。

备注:
如果要重复初始化，先重置 kubeadm
root@k8s-master ~l# kubeadm reset
初始化也可以用如下方法:
Kubeadm init
--apiserver-advertise-address=192.168.10.101--image-repository registry.aliyuncs.com/google containers--kubernetes-version v1.23.0
--service-cidr=10.96.0.0/12
--pod-network-cidr=10.244.0.0/16
--ignore-preflight-errors=all

备注:
如果安装的 1.24.8 的版本，需要设置 containerd 服务的资源限制
cat >/etc/containerd/config.tom1<<EOF[plugins."io.containerd.grpc.v1.cri"]systemd cgroup = true
EOF

(12)复制配置文件到用户的 home 目录

操作节点:k8s-master

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g)$HOME/.kube/config

(13)node 节点加入集群

操作节点:k8s-node01、k8s-node02
注意:红色部分是在 master 中生成的 token，直接在 master 主机中复制过来即可

Kubeadm join 192.168.10.101:6443 --token abcdef.0123456789abcdef \
--discovery-token-ca-cert-hash
sha256:8b17b7d607ab7f79c2249c58d74525368bbb15ad884c365aaa1a968b9833d107

(14)在k8s-master 查看节点

echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> ~/.bash profilesource ~/.bash profile
kubectl get nodes
NAME        STATUS        ROLES        AGE        VERSION
k8s-master    NotReady    master       13m        v1.19.4
k8s-node01    NotReady    <none>       2m30s      v1.19.4
k8s-node02    NotReady    <none>        21s         v1.19.4

注意:因为此时还没安装网络插件，coredns 无法获得解析的 IP,就会使得 coredns 处于 pending状态

(15)安装flannel网络

(16)查看节点状态

(17)部署 Calico 网络插件

kubectl apply -f https://docs.projectcalico.org/manifests/calico.yaml

备注:
也可以提前下载好 calica 的资源清单直接部署

[root@k8s-master ~]# kubectl create -f calico.yaml

kubectl get pod--all-namespaces

四、Metrics-server部署

Metrics Server 是一种可扩展、高效的容器资源指标来源，适用于 Kubernetes 内置的自动缩放管道。Metrics Server 从 Kubelets 收集资源指标，并通过 Metrics API 将它们暴露在Kubernetes apiserver 中,供Horizontal Pod Autoscaler 和 Vertical Pod Autoscaler使用。指标 API 也可以通过访问 kubectl top，从而更容易调试自动缩放管道。

Metrics Server 对集群和网络配置有特定的要求。这些要求并不是所有集群分布的默认要求在使用 Metrics server 之前，请确保您的集群分布支持这些要求:

kube-apiserver 必须启用聚合层。
节点必须启用 Webhook 身份验证和授权。
Kubelet 证书需要由集群证书颁发机构签名(或通过传递--kubelet-insecure-tls 给Metrics server 来禁用证书验证)注意这里是重点，如果本地没有签名需要传递 args:"--kubelet-insecure-tls"给Metrics Server
容器运行时必须实现容器指标 RPC(或具有 cAdvisor 支持)
网络应支持以下通信:
- (1)控制平面到指标服务器。控制平面节点需要到达 Metrics Server 的 pod IP 和端口 10250(或节点 IP 和自定义端口，如果 hostNetwork 已启用)
- (2)所有节点上的 Kubelet 的指标服务器。指标服务器需要到达节点地址和 Kubelet 端口。地址和端口在 Kubelet 中配置并作为 Node 对象的一部分发布。字段中的地和址端H.status.daemonEndpoints.kubeletEndpoint.port(默认 10250)。MetricsServer将根据kubelet-preferred-address-types 命令行标志(InternalIP,ExternalIP,Hostname 清单中的默认值)提供的列表选择第一个节点地址

源码位置:
metrics-server的github 地址:https://github.com/kubernetes-sigs/metrics-server

版本对照

1.下载 Metrics-server 的 yaml文件

wget
/releases/download/v0.6.3/comhttps://github.com/kubernetes-sigs/metrics-serverponents.yaml

2.修改 yaml 文件并安装

vim components.yaml
spec:
containers:
- args:
##添加--kubelet-insecure-tls
---cert-dir=/tmp
--secure-port=4443
---kubelet-preferred-address-types=InternalIP,ExternalIP,Hostname
--kubelet-use-node-status-port
--metric-resolution=15s
image:registry.cn-hangzhou.aliyuncs.com/google containers/metrics-server:vo.6.3

kubectl create -f components.yaml

3.测试安装结果

五、Dashboard 部署

核心文件官方下载资源地址:
https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/dashboard

1.在 k8s 工作目录中创建 dashborad 工作目录

mkdir /opt/k8s/dashboard
cd /opt/k8s/dashboard

2.上传所需的 yaml 文件井部署 dashboard:

ls
dashboard-user.yamldashboard.yaml
kubectl create -f .

3.修改谷歌浏览器

k8s 的 dashboard 采用的是自签名证书访问的，谷歌浏览器默认无法直接访问(其他浏览器可以,如火狐)，需要修改谷歌浏览器启动文件，加入启动参数，忽略证书报错，用于解决无法访问dashboard 的问题。
修改方法如下:
在桌面找到谷歌浏览器的快捷方式
右键属性
找到“快捷方式”选项卡
在目标栏添加参数:--test-type--ignore-certificate-errors(注意--前有空格)

4.查看端口号

5.查看token

备注:每个 k8s 的环境都会获得自己的 Dashboard 端口，和自己的 Token，要使用自己的端口和
Token 登录。

6.登录 dashboard

https://192.168.10.101:31245/

六、测试

1.安装 helm 客户端

(1)下载安装包

wget https://get.helm.sh/helm-v3.9.4-linux-amd64.tar.gz

(2)解压

tar zxvf helm-v3.9.4-linux-amd64.tar.gz

(3)安装

mv linux-amd64/helm /usr/local/bin/

(4)查看版本

helm version
version.BuildInfo{Version:"v3.9.4"
GitCommit:"ee407bdf364942bcb8e8c665f82e15aa28009b71"GitTreestate:"clean",
GoVersion:"go1.16.5"}