阿里云部署K8s及一些排错体会

前言

本文介绍如何在ubuntu上部署k8s集群,大致可以分为如下几个步骤:

  • 修改ubuntu配置
  • 安装docker
  • 安装kubeadmkubectl以及kubelet
  • 初始化master节点
  • slave节点加入网络

在这里插入图片描述
因为k8s分为管理节点工作节点,所以我们将要 在master上部署管理节点,在slave01上部署工作节点

本文的 docker、k8s 软件安装具体版本。
在这里插入图片描述
首先,k8s 要求我们的 ubuntu 进行一些符合它要求的配置。很简单,包括以下两步:关闭 Swap 内存 以及 配置免密登录,这一步两台主机都需要进行配置。

关闭 swap 内存

这个swap其实可以类比成 windows 上的虚拟内存,它可以让服务器在内存吃满的情况下可以保持低效运行,而不是直接卡死。但是 k8s 的较新版本都要求关闭swap。所以咱们直接动手,修改**/etc/fstab**文件:

vi /etc/fstab

你应该可以看到如下内容,把第二条用#注释掉就好了,注意第一条别注释了,不然重启之后系统有可能会报file system read-only错误。

UUID=0ecd04d2-a439-4333-aa3d-1b74209bd82a /               ext4    errors=remount-ro 0       1
#/dev/fd0        /media/floppy0  auto    rw,user,noauto,exec,utf8 0       0

然后输入reboot重启即可,重启后使用top命令查看任务管理器,如果看到如下KiB Swap后均为 0 就说明关闭成功了。
在这里插入图片描述

配置免密登录

k8s 要求 管理节点可以直接免密登录工作节点 的原因是:在集群搭建完成后,管理节点的 kubelet 需要登陆工作节点进行操作。具体操作看一下这个传送门里面的文章传送门(ssh免密登陆)

二. 安装 docker

docker 是 k8s 的基础,在安装完成之后也需要修改一些配置来适配 k8s ,所以本章分为 docker 的安装docker 的配置 两部分。如果你已经安装并使用了一段时间的 docker 了话,建议使用docker -v查看已安装的 docker 版本,并在 k8s 官网上查询适合该版本的 k8s 进行安装。这一步两台主机都需要进行安装

docker 的安装

docker 在 ubuntu 的安装上真是再简单不过了,执行如下命令即可,在安装之前请记得把镜像源切换到国内。

apt install docker.io

等安装完成之后使用docker -v来验证 docker是否可用。
docker 的配置
安装完成之后需要进行一些配置,包括 切换docker下载源为国内镜像站 以及 修改cgroups

这个cgroups是啥呢,你可以把它理解成一个进程隔离工具,docker就是用它来实现容器的隔离的。docker 默认使用的是cgroupfs,而 k8s 也用到了一个进程隔离工具systemd,如果使用两个隔离组的话可能会引起异常,所以我们要把 docker 的也改成systemd。

这两者都是在/etc/docker/daemon.json里修改的,所以我们一起配置了就好了,首先执行下述命令编辑daemon.json

vi /etc/docker/daemon.json

打开后输入以下内容:

{
  "registry-mirrors": [
    "https://dockerhub.azk8s.cn",
    "https://reg-mirror.qiniu.com",
    "https://quay-mirror.qiniu.com"
  ],
  "exec-opts": [ "native.cgroupdriver=systemd" ]
}

然后:wq保存后重启 docker:

systemctl daemon-reload
systemctl restart docker

然后就可以通过docker info | grep Cgroup来查看修改后的 docker cgroup 状态,发现变为systemd即为修改成功。

三. 安装 k8s

安装完了 docker 就可以下载 k8s 的三个主要组件kubelet、kubeadm以及kubectl了。这一步两台主机都需要进行安装。先来简单介绍一下这三者:

kubelet: k8s 的核心服务
kubeadm: 这个是用于快速安装 k8s 的一个集成工具,我们在masterslave01上的 k8s 部署都将使用它来完成。
kubectl: k8s 的命令行工具,部署完成之后后续的操作都要用它来执行
其实这三个的下载很简单,直接用apt-get就好了,但是因为某些原因,它们的下载地址不存在了。所以我们需要用国内的镜像站来下载,也很简单,依次执行下面五条命令即可:

# 使得 apt 支持 ssl 传输
apt-get update && apt-get install -y apt-transport-https
# 下载 gpg 密钥
curl https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg | apt-key add - 
# 添加 k8s 镜像源
cat <<EOF >/etc/apt/sources.list.d/kubernetes.list
deb https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main
EOF
# 更新源列表
apt-get update
# 下载 kubectl,kubeadm以及 kubelet
apt-get install -y kubelet kubeadm kubectl

直接在/etc/apt/sources.list里添加https://mirrors.aliyun.com/kubernetes/apt/是不行的,因为这个阿里镜像站使用的ssl进行传输的,所以要先安装apt-transport-https并下载镜像站的密钥才可以进行下载。
注:
如果安装完kubelet kubeadm kubectl后,节点报版本问题的错误,可以安装指定版本的kubelet kubeadm kubectl解决问题。
下载“1.15.1-00”版本,(我在安装时就是用了如下方式进行安装)。

apt-get install -y kubelet=1.15.1-00 kubeadm=1.15.1-00 kubectl=1.15.1-00

四. 安装 master 节点

下载完成后就要迎来重头戏了,初始化master节点,这一章节只需要在管理节点上配置即可,大致可以分为如下几步:

  • 初始化master节点
  • 部署flannel网络
  • 配置kubectl工具

初始化 master 节点

使用kubeadminit命令就可以轻松的完成初始化,不过需要携带几个参数,如下。先不要直接复制执行,将赋值给–apiserver-advertise-address参数的 ip 地址修改为自己的master主机地址,然后再执行。

kubeadm init  \
--image-repository registry.cn-hangzhou.aliyuncs.com/google_containers \
--kubernetes-version=v1.15.1 \
--pod-network-cidr=10.244.0.0/16

这里介绍一下一些常用参数的含义:

  • - -apiserver-advertise-address: k8s 中的主要服务apiserver的部署地址,填自己的管理节点 ip
  • - -image-repository: 拉取的 docker 镜像源,因为初始化的时候kubeadm会去拉 k8s 的很多组件来进行部署,所以需要指定国内镜像源,下不然会拉取不到镜像。
  • - -pod-network-cidr: 这个是 k8s 采用的节点网络,因为我们将要使用flannel作为 k8s 的网络,所以这里填10.244.0.0/16就好
  • - -kubernetes-version: 这个是用来指定你要部署的 k8s 版本的,一般不用填,不过如果初始化过程中出现了因为版本不对导致的安装错误的话,可以用这个参数手动指定。
  • - -ignore-preflight-errors: 忽略初始化时遇到的错误,比如说我想忽略 cpu 数量不够 2 核引起的错误,就可以用–ignore-preflight-errors=CpuNum。错误名称在初始化错误时会给出来。
    注:
    ①init时,也可以不带–apiserver-advertise-address,K8S会自动指定自己系统的主机ip,如果需要指定公网IP则必须携带此参数。
    ②- -pod-network-cidr参数一定要带,否则master的kube-flannel-ds会出现错误CrashLoopBackOff。
    ③- -kubernetes-version,如果之前安装kubelet kubeadm kubectl时候指定了版本,init master时可以不带此参数也是会初始化成功的,k8s自动的选择版本进行初始化。

当你看到如下字样是,就说明初始化成功了,请把最后那行以kubeadm join开头的命令复制下来,之后安装工作节点时要用到的,如果你不慎遗失了该命令,可以在master节点上使用kubeadm token create --print-join-command命令来重新生成一条。

Your Kubernetes master has initialized successfully!
 
To start using your cluster, you need to run the following as a regular user:
 
  mkdir -p $HOME/.kube
  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  sudo chown $(id -u):$(id -g) $HOME/.kube/config
 
You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
  https://kubernetes.io/docs/concepts/cluster-administration/addons/
 
You can now join any number of machines by running the following on each node
as root:
 
kubeadm join 172.17.195.122:6443 --token eokszg.2a3i5608kfuwdza6 \
    --discovery-token-ca-cert-hash sha256:f155433a005a2063c4292cdbb516dfafec4baeba177be8302940bfef9faa4cc3 

注:
#生成的join没有保存或者忘记,输入kubeadm token create --print-join-command重新生成一条。

kubeadm token create --print-join-command
kubeadm join 172.17.195.122:6443 --token fq73k4.1boyv4wa3swhmm03     --discovery-token-ca-cert-hash sha256:ad8f43188e599f0e07334df58836e177b93aa6e998bfc6f8798811181cfd5743 

如果在初始化过程中出现了任何Error导致初始化终止了,使用

kubeadm reset重置之后再重新进行初始化。 配置 kubectl 工具

这一步就比较简单了,直接执行如下命令即可:

mkdir -p /root/.kube && \
cp /etc/kubernetes/admin.conf /root/.kube/config

执行完成后并不会刷新出什么信息,可以通过下面两条命令测试 kubectl是否可用:

# 查看已加入的节点
kubectl get nodes
# 查看集群状态
kubectl get cs

部署 flannel 网络

flannel是什么?它是一个专门为 k8s 设置的网络规划服务,可以让集群中的不同节点主机创建的 docker 容器都具有全集群唯一的虚拟IP地址。想要部署flannel的话直接执行下述命令即可:

kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/a70459be0084506e4ec919aa1c114638878db11b/Documentation/kube-flannel.yml

输出如下内容即为安装完成:

clusterrole.rbac.authorization.k8s.io/flannel created
clusterrolebinding.rbac.authorization.k8s.io/flannel created
serviceaccount/flannel created
configmap/kube-flannel-cfg created
daemonset.extensions/kube-flannel-ds-amd64 created
daemonset.extensions/kube-flannel-ds-arm64 created
daemonset.extensions/kube-flannel-ds-arm created
daemonset.extensions/kube-flannel-ds-ppc64le created
daemonset.extensions/kube-flannel-ds-s390x created

至此,k8s 管理节点部署完成。

五. slave 节点

将 slave 节点加入网络
首先需要重复步骤 1 ~ 3 来安装 docker 、k8s 以及修改服务器配置,之后执行从步骤 4 中保存的命令即可完成加入,注意,这条命令每个人的都不一样,不要直接复制执行:

kubeadm join 172.17.195.122:6443 --token fq73k4.1boyv4wa3swhmm03     --discovery-token-ca-cert-hash sha256:ad8f43188e599f0e07334df58836e177b93aa6e998bfc6f8798811181cfd5743 

待控制台中输出以下内容后即为加入成功:

This node has joined the cluster:
* Certificate signing request was sent to apiserver and a response was received.
* The Kubelet was informed of the new secure connection details.
Run 'kubectl get nodes' on the master to see this node join the cluster.

随后登录master查看已加入节点状态,可以看到slave01已加入,并且状态均为就绪。至此,k8s 搭建完成:

root@master:~# kubectl get nodes
NAME      STATUS   ROLES    AGE    VERSION
master    Ready    master   3d1h   v1.15.1
slave01   Ready    <none>   2d5h   v1.15.1

大注特注(遇到错误怎么办,部署失败怎么办):

①K8S部署一遍可能不会成功,会遇到好多好多的问题,我们可以通过自己的一些手段才排查。

查看nodes状态,各node是否ready

kubectl get nodes

查看pods状态,各pod是否ready

kubectl get pods --all-namespaces

如果有不ready的node或者pod,查看kuberctl.services日志进行分析

journalctl -f -u kubelet.service

查看指定pod的日志,xxx是pod名称,可以通过kubectl get pods获得pod的name

kubectl describe pod   xxx

查看deployment

kubectl get deployment  

日志具体有什么错误,通过百度搜索错误来排除错误。
②如果日志没有错误,出现连接超时或者连接拒绝等问题,又或者kuberctl.services日志里根本没有错误。
考虑是不是端口未开放
lsof -i:xxx ,如果返回信息则代表端口开放
同时,阿里云后台的端口限制也需要解除,只打开服务器的端口是不够的。
③如果节点无法加入k8s集群(提示验证失败,tomeout=10),考虑各虚拟机的时间是否校准

timedatectl #查看各个机器的时间是否统一

如果不统一,则点击这个传送门查看校准时间方法
④注意k8s是否和虚拟机内核相匹配,有内核版本冲突之类的问题。
此处举一个例子,kubelet cgroup driver: “cgroupfs” is different from docker cgroup driver: “systemd”。

tips:

给大家一些当时我用到的排错网站。
传送门,里面综合一些K8S的问题,相信对大家部署和学习k8s会有一些帮助。

错误 “cni0” already has an IP address different from xxxx解决办法

kubernetes更换IP地址重新初始化master节点

通过上网搜索日志的错误提示,可以解决掉绝大部分的问题,大家一起努力,对K8S有更深入的体会和认识。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值