本文将快速搭建一套K8s集群。
一、准备环境
服务器要求:
- 建议最小硬件配置:2核CPU、2G内存、20G硬盘
- 服务器最好可以访问外网,会有从网上拉取镜像需求,如果服务器不能上网,需要提前下载对应镜像并导入节点
三台centos虚拟机,一台作为主节点,两台作为从节点
角色 | IP地址 | CPU | 内存 | 硬盘 |
k8s-master | 192.168.124.222 | 2核 | 2G | 20G |
k8s-node1 | 192.168.124.223 | 2核 | 2G | 20G |
k8s-node2 | 192.168.124.224 | 2核 | 2G | 20G |
1、操作系统初始化配置【所有节点】
# 关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
# 关闭selinux
sed -i 's/enforcing/disabled/' /etc/selinux/config # 永久
setenforce 0 # 临时
# 关闭swap
swapoff -a # 临时
sed -ri 's/.*swap.*/#&/' /etc/fstab # 永久
# 根据规划设置主机名
hostnamectl set-hostname <hostname>
# 在master添加hosts
cat >> /etc/hosts << EOF
192.168.124.222 k8s-master
192.168.124.223 k8s-node1
192.168.124.224 k8s-node2
EOF
# 将桥接的IPv4流量传递到iptables的链
cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sysctl --system # 生效
# 时间同步
yum install ntpdate -y
ntpdate time.windows.com
2、 安装Docker/kubeadm/kubelet【所有节点】
2.1 安装Docker
wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo #下载docker镜像包
yum -y install docker-ce #下载安装
systemctl enable docker && systemctl start docker #设置开机自启docker
配置镜像下载加速器:
cat > /etc/docker/daemon.json << EOF
{
"registry-mirrors": [
"https://docker.1ms.run",
"https://docker.xuanyuan.me"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
2.2 安装cri-dockerd
Kubernetes v1.24移除docker-shim的支持,而Docker Engine默认又不支持CRI标准,因此二者默认无法再直接集成。为此,Mirantis和Docker联合创建了cri-dockerd项目,用于为Docker Engine提供一个能够支持到CRI规范的桥梁,从而能够让Docker作为Kubernetes容器引擎。
wget https://github.com/Mirantis/cri-dockerd/releases/download/v0.3.2/cri-dockerd-0.3.2-3.el7.x86_64.rpm #获取cri-dockerd安装包
rpm -ivh cri-dockerd-0.3.2-3.el7.x86_64.rpm #安装
指定依赖镜像地址:
vi /usr/lib/systemd/system/cri-docker.service
ExecStart=/usr/bin/cri-dockerd --container-runtime-endpoint fd:// --pod-infra-container-image=registry.aliyuncs.com/google_containers/pause:3.9
systemctl daemon-reload
systemctl enable cri-docker && systemctl start cri-docker
2.3 添加阿里云YUM软件源
cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
2.4 安装kubeadm,kubelet和kubectl
这里指定版本号部署:
yum install -y kubelet-1.28.0 kubeadm-1.28.0 kubectl-1.28.0
systemctl enable kubelet
3、 部署Kubernetes【master节点】
在192.168.124.222(Master)服务器执行:
kubeadm init \
--apiserver-advertise-address=192.168.124.222 \
--image-repository registry.aliyuncs.com/google_containers \
--kubernetes-version v1.28.0 \
--service-cidr=10.96.0.0/12 \
--pod-network-cidr=10.244.0.0/16 \
--cri-socket=unix:///var/run/cri-dockerd.sock \
--ignore-preflight-errors=all
- --apiserver-advertise-address 集群通告地址
- --image-repository 由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址
- --kubernetes-version K8s版本,与上面安装的一致
- --service-cidr 集群内部虚拟网络,Pod统一访问入口
- --pod-network-cidr Pod网络,与下面部署的CNI网络组件yaml中保持一致
- --cri-socket 指定cri-dockerd接口,如果是containerd则使用--cri-socket unix:///run/containerd/containerd.sock
初始化完成后,最后会输出一个join命令,先保存,后面从节点加入集群会用到。
*如果没有保存也可以用kubeadm token create --print-join-command命令重新生成token
接着,拷贝kubectl使用的连接k8s认证文件到默认路径:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
此时就可以使用kubectl工具管理K8s集群了,例如查看工作节点:
节点状态为NotReady,是因为没有安装网络插件,后面从节点加入后会安装部署。
3、从节点加入集群【node节点】
在192.168.124.223/224(Node节点)执行主节点初始化时生成的join语句,以下就代表节点已经加入集群:
4、安装网络插件【master节点】
本次安装的网络插件是Calico,是目前K8s常用的网络方案。
可以查看官方文档进行部署:https://docs.tigera.io/calico/latest/getting-started/kubernetes/quickstart
首先从github上获取并创建两个yaml文件:
kubectl create -f https://raw.githubusercontent.com/projectcalico/calico/v3.29.2/manifests/tigera-operator.yaml
kubectl create -f https://raw.githubusercontent.com/projectcalico/calico/v3.29.2/manifests/custom-resources.yaml
custom-resources.yaml文件中要注意Pod网络的地址和主节点初始化的Pod网络地址一致
创建部署资源后,使用以下命令来确保所有pod都在运行
watch kubectl get pods -n calico-system
如果容器处于ContainerCreating状态说明在创建镜像中,会比较慢,取决于本地网络。
5、部署 Dashboard【master节点】
Dashboard是官方提供的一个UI,可用于基本管理K8s资源。
同样也需要下载一个yaml文件:
wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.7.0/aio/deploy/recommended.yaml
下载下来后,需要修改配置文件将服务暴露到外部,不然只能集群内部访问。
#更新资源配置文件到k8s集群中
kubectl apply -f recommended.yaml
#查看 kubernetes-dashboard 命名空间中的所有 Pod 的状态和信息
kubectl get pods -n kubernetes-dashboard
创建service account并绑定默认cluster-admin管理员集群角色:
# 创建用户
kubectl create serviceaccount dashboard-admin -n kubernetes-dashboard
# 用户授权
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kubernetes-dashboard:dashboard-admin
# 获取用户Token,每次使用都会新生成Token,之前生成的Token会作废
kubectl create token dashboard-admin -n kubernetes-dashboard
使用输出的token登录Dashboard。将进入到首页,如图所示:
问题解决:
报错:
[root@k8s-node2 ~]# kubeadm join 192.168.124.222:6443 --token 9k6b0f.qxgcphu3a0vojhj5 --discovery-token-ca-cert-hash sha256:a08e6f0de63297aa1a88563db346a4150d4e607ab3a9c64d44dccb59b2ea9083
Found multiple CRI endpoints on the host. Please define which one do you wish to use by setting the 'criSocket' field in the kubeadm configuration file: unix:///var/run/containerd/containerd.sock, unix:///var/run/cri-dockerd.sock
To see the stack trace of this error execute with --v=5 or higher
解决方法:这是表示在主机上找到多个CRI端口,可能是系统上运行了多个容器containerd或Docker。可以在join语句后面添加--cri-socket=unix:///var/run/containerd/containerd.sock或者--cri-socket=unix:///var/run/cri-dockerd.sock来指定容器执行命令
K8s常用命令
1. 查看资源信息
-
kubectl get
:获取资源信息。kubectl get nodes
:查看集群节点。kubectl get pods
:查看所有Pod。kubectl get services
:查看服务。kubectl get deployments
:查看Deployment。
-
kubectl describe
:详细查看资源状态。kubectl describe pod <pod-name>
:查看Pod的详细信息。
-
kubectl cluster-info
:获取集群基本信息,如组件版本。
2. 管理资源
-
kubectl apply
:应用资源配置文件。kubectl apply -f <filename.yaml>
:创建或更新资源。
-
kubectl delete
:删除资源。kubectl delete -f <filename.yaml>
:删除资源。
-
kubectl scale
:调整副本数量。kubectl scale deployment my-dep --replicas=3
:将Deployment的副本数调整为3。
3. 查看日志和进入容器
-
kubectl logs
:查看Pod的日志。kubectl logs <pod-name>
:查看指定Pod的日志。kubectl logs -f <pod-name>
:实时查看日志。
-
kubectl exec
:进入容器执行命令。kubectl exec -it <pod-name> -- /bin/bash
:进入Pod的容器,使用bash shell。
4. 权限和配置管理
-
kubectl auth
:管理权限。kubectl auth can-i <verb> <resource>
:检查权限。
-
kubectl config
:管理kubeconfig文件。kubectl config get-contexts
:查看上下文列表。kubectl config use-context <context-name>
:切换上下文。
5. 资源使用情况
kubectl top
:查看资源使用情况。kubectl top pods
:查看Pod的资源使用情况。kubectl top nodes
:查看节点的资源使用情况。
6. 部署和更新
kubectl rollout
:管理Deployment的滚动更新。kubectl rollout history deployment/<deployment-name>
:查看更新历史。kubectl rollout undo deployment/<deployment-name>
:回滚到之前的版本。
7. 调试和故障排除
kubectl get pods -o wide
:查看Pod的详细信息,包括节点和IP地址。kubectl get events
:查看集群中的事件,帮助排查问题。
8. 其他常用命令
kubectl proxy
:启动一个代理服务器,方便访问API资源。kubectl cp
:在Pod和本地之间复制文件