k8s集群安装及相关问题解决

最新推荐文章于 2024-06-12 17:23:30 发布

海光之蓝

最新推荐文章于 2024-06-12 17:23:30 发布

阅读量465

点赞数

分类专栏： k8s linux

本文链接：https://blog.csdn.net/u013078871/article/details/112255496

版权

linux 同时被 2 个专栏收录

30 篇文章 1 订阅

订阅专栏

k8s

7 篇文章 0 订阅

订阅专栏

1.各机器安装docker
docker安装可参照菜鸟教程：centos安装docker
安装如果版本太新可能会报以下错误

[root@slave01 ~]# sudo yum install docker-ce-20.10.2 docker-ce-cli-20.10.2 containerd.io
上次元数据过期检查：0:16:22 前，执行于 2021年01月05日 星期二22时32分37秒。
错误：
 问题: package docker-ce-3:20.10.2-3.el7.x86_64 requires containerd.io >= 1.4.1, but none of the providers can be installe                                                                 d
  - conflicting requests
  - package containerd.io-1.4.3-3.1.el7.x86_64 is filtered out by modular filtering
(尝试添加 '--skip-broken' 来跳过无法安装的软件包 或 '--nobest' 来不只使用最佳选择的软件包)

此时需安装新的containerd.io,选择大于或等于需要的版本进行安装

yum install -y https://download.docker.com/linux/centos/8/x86_64/nightly/Packages/containerd.io-1.4.3-3.1.el8.x86_64.rpm
#或者下载rpm上传安装
yum install -y containerd.io-1.4.3-3.1.el8.x86_64.rpm

2.docker安装完成后使用dockers -v查看版本信息，此时可以尝试启动doceker,启动成功直接下一步，如果启动失败，报一下错的解决步骤：
报错如下：
在这里插入图片描述
首先尝试关闭被屏蔽的docker,命令如下：

systemctl unmask docker.service
systemctl unmask docker.socket
systemctl start docker

如果还是没有解除屏蔽则需要将docker卸载重装：
docker卸载：

#查询安装过的软件包
yum list installed | grep docker
#卸载安装的软件包
yum -y remove  docker-ce.x86_64
#删除Docker存储文件
rm -rf /var/lib/docker
#重新执行docker安装命令，这里安装的是最新版
sudo yum install docker-ce docker-ce-cli containerd.io -y

在这里插入图片描述
最后启动docker并将其加入开机启动

systemctl start docker
systemctl enable docker

3.配置docker阿里云镜像地址并使用systemd来代替cgroupfs

sudo tee /etc/docker/daemon.json <<-'EOF'
{
 "exec-opts": ["native.cgroupdriver=systemd"],
  "registry-mirrors": ["https://你自己的.mirror.aliyuncs.com"]
}
EOF
#重启docker
systemctl restart docker

4.k8s基础组件安装
配置k8s阿里云镜像

cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

安装k8s基础组件，在此安装最新版：

#查看可安装的版本
yum list kubelet kubeadm kubectl  --showduplicates|sort -r
#安装最新版
yum install kubectl kubelet kubeadm -y
#安装完成后版本检查
kubeadm version
kubectl version
kubectl version --short=true
kubelet --version
#将kubelet加入开机启动
systemctl enable kubelet

配置kubelet的cgroup

vi /etc/sysconfig/kubelet
#添加以下内容
KUBELET_EXTRA_ARGS=
KUBELET_CGROUP_ARGS="--cgroup-driver=systemd"
KUBE_PROXY_MODE="ipvs"

5.查看所需镜像可以通过下面命令查看

kubeadm config images list

在这里插入图片描述
6.（方式1，提前下载好需要镜像）定义一个待下载的镜像数据集,所有服务器都要下载该镜像

images=(
kube-apiserver:v1.20.1
kube-controller-manager:v1.20.1
kube-scheduler:v1.20.1
kube-proxy:v1.20.1
pause:3.2
etcd:3.4.13-0
coredns:1.7.0
)

for循环下在并使用docker tag命令标记本地镜像，将其归入谷歌仓库

for imageName in ${images[@]} ; do 
docker pull registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName 
docker tag registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageName 
docker rmi registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName 
done

若不提前做如此转换也可在初始化k8s集群时指定镜像地址
参考：使用kubeadm在Centos8上部署kubernetes1.18
7.k8s集群初始化

kubeadm init \
--kubernetes-version=v1.20.1 \
--pod-network-cidr=10.244.0.0/16 \
--service-cidr=10.96.0.0/12 \
--apiserver-advertise-address=192.168.56.105

（方式2，初始化时指定阿里云仓库）

kubeadm init \
--kubernetes-version=v1.20.1 \
--pod-network-cidr=10.244.0.0/16 \
--service-cidr=10.96.0.0/12 \
--apiserver-advertise-address=192.168.56.105 \
--image-repository registry.aliyuncs.com/google_containers \
--ignore-preflight-errors=all

执行后报如下错误

[root@master01 ~]# kubeadm init \
> --kubernetes-version=v1.20.1 \
> --pod-network-cidr=10.244.0.0/16 \
> --service-cidr=10.96.0.0/12 \
> --apiserver-advertise-address=192.168.56.105
[init] Using Kubernetes version: v1.20.1
[preflight] Running pre-flight checks
        [WARNING FileExisting-tc]: tc not found in system path
        [WARNING SystemVerification]: this Docker version is not on the list of validated versions: 20.10.2. Latest validated version: 19.03
error execution phase preflight: [preflight] Some fatal errors occurred:
        [ERROR NumCPU]: the number of available CPUs 1 is less than the required 2
[preflight] If you know what you are doing, you can make a check non-fatal with `--ignore-preflight-errors=...`
To see the stack trace of this error execute with --v=5 or higher

错误的意思是，20.10.2版本docker未做验证，已验证的最高版本为19.03
解决1：降低docker版本至指定版本
解决2：忽略所有版本检查，修改后命令如下：

kubeadm init \
--kubernetes-version=v1.20.1 \
--pod-network-cidr=10.244.0.0/16 \
--service-cidr=10.96.0.0/12 \
--apiserver-advertise-address=192.168.56.105 \
--ignore-preflight-errors=all

初始化成功如下：
在这里插入图片描述
根据提示，继续执行命令创建必要文件

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

在这里插入图片描述
参考博客：使用kubeadm建立kubernetes集群
在node机上将node节点加入到master集群种（自己根据自己集群提示加入，以下为我本次试验机）：

kubeadm join 192.168.56.105:6443 --token asfqrj.hg9jqw71wop8qhhg \
    --discovery-token-ca-cert-hash sha256:d4614a6d5457ed9e634758e004442ebb3542f89a714888cb8a0387d99eda8d28

加入完查看集群节点信息：
在这里插入图片描述
8.安装集群网络插件
查看k8s官方支持的网络插件：
k8s网络插件
这里选择flannel
flannel
运行安装：

#方式1
kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
#方式2，下载后安装
wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

kubectl apply -f kube-flannel.yml```

运行成功如下稍等片刻：
在这里插入图片描述
查看集群状态如下表示成功：

安装网络插件可能出现的错误及解决办法：

此时需要修改hosts,重新定义raw.githubusercontent.com映射的ip
ip查看：
ipaddress

修改hosts,添加：
199.232.96.133 raw.githubusercontent.com
重新运行即可：
备用ip查询选中国香港（我这里不能连，只能使用上面的方法）：
IP38

至此k8s单节点集群已搭建成功
可能遇到的问题与解决办法：
quay.io/coreos/flannel:v0.13.1-rc1镜像下载失败，正常情况下kube-system空间中的所有pod都应该处于运行状态：
在这里插入图片描述
如果网络插件未安装成功，所有节点将储于notready状态。
镜像下载不了可更换镜像下载仓库：

#仓库1
sed -i 's/quay.io/quay-mirror.qiniu.com/g' kube-flannel.yml
#仓库2
sed -i 's/quay.io/quay.azk8s.cn/g' kube-flannel.yml

如果都不行，就只能自己下载好镜像自己导入到待安装的机器中了

#从已有的镜像中导出
docker save -o flannel2.tar quay.io/coreos/flannel:v0.13.1-rc1
#从tar文件中导入
docker load -i flannel2.tar

（注意：手动导入的镜像，每个安装节点都需要导入）

9.下面部署一个应用进行集群测试

kubectl create deployment nginx --image=nginx:alpine
kubectl scale deployment nginx --replicas=2
#查看应用状态
kubectl get pods -l app=nginx -o wide
#暴露端口
kubectl expose deployment nginx --port=80 --type=NodePort
#查看service
kubectl get services nginx

在这里插入图片描述
此时尝试通过节点ip加端口访问，发现访问不到，此时进入道node节点进行访问，报如下错误

解决办法：

#主节点复制该文件到所有的子节点
 scp /etc/kubernetes/admin.conf root@slave02:/etc/kubernetes/
 #再在子节点执行以下命令
 mkdir -p $HOME/.kube
 sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
 sudo chown $(id -u):$(id -g) $HOME/.kube/config

此时在子节点尝试访问，发现可以访问成功，然后使用浏览器进行访问，也可访问成功，但是有时候有不能访问的情况，具体原因还没有往下深究。

海光之蓝

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
k8s集群安装及相关问题解决

1.各机器安装dockerdocker安装可参照菜鸟教程：centos安装docker安装如果版本太新可能会报以下错误[root@slave01 ~]# sudo yum install docker-ce-20.10.2 docker-ce-cli-20.10.2 containerd.io上次元数据过期检查：0:16:22 前，执行于 2021年01月05日星期二22时32分37秒。错误：问题: package docker-ce-3:20.10.2-3.el7.x86_64 requi
复制链接

扫一扫