K8S快速搭建手记

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。
这个工具能通过两条指令完成一个kubernetes集群的部署:

创建一个 Master 节点

$ kubeadm init

将一个 Node 节点加入到当前集群中

$ kubeadm join <Master节点的IP和端口 >

  1. 安装要求
    在开始之前,部署Kubernetes集群机器需要满足以下几个条件:
    一台或多台机器,操作系统 CentOS7.x-86_x64
    硬件配置:2GB或更多RAM,2个CPU或更多CPU,硬盘30GB或更多
    集群中所有机器之间网络互通
    可以访问外网,需要拉取镜像
    禁止swap分区
  2. 学习目标
    1.在所有节点上安装Docker和kubeadm
    2.部署Kubernetes Master
    3.部署容器网络插件
    4.部署 Kubernetes Node,将节点加入Kubernetes集群中
    5.部署Dashboard Web页面,可视化查看Kubernetes资源
  3. 准备环境

角色 IP
k8s-master 192.168.231.132
k8s-node 192.168.231.133
以下红字很重要:
关闭防火墙:
$ systemctl stop firewalld
$ systemctl disable firewalld

关闭selinux:
$ sed -i ‘s/enforcing/disabled/’ /etc/selinux/config # 永久
$ setenforce 0 # 临时

关闭swap:
$ swapoff -a # 临时
$ sed -ri ‘s/.swap./#&/’ /etc/fstab #永久

$ vim /etc/fstab # 永久
删除 /mnt/swap swap swap defaults 0 0 这一行或者注释掉这一行

设置主机名:
$ hostnamectl set-hostname

在master添加hosts:
$ cat >> /etc/hosts << EOF
192.168.231.132 k8s-master
192.168.231.133 k8s-node
EOF

将桥接的IPv4流量传递到iptables的链:
$ cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
$ sysctl --system # 生效

时间同步:
$ yum install ntpdate -y
$ ntpdate time.windows.com
4. 所有节点安装Docker/kubeadm/kubelet
Kubernetes默认CRI(容器运行时)为Docker,因此先安装Docker。
4.1 安装Docker
$ wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
$ yum -y install docker-ce-18.06.1.ce-3.el7
$ systemctl enable docker && systemctl start docker
$ docker --version
Docker version 18.06.1-ce, build e68fc7a

cat > /etc/docker/daemon.json << EOF

{
“registry-mirrors”: [“https://b9pmyelo.mirror.aliyuncs.com”]
}
EOF
4.2 添加阿里云YUM软件源
$ cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
4.3 安装kubeadm,kubelet和kubectl
由于版本更新频繁,这里指定版本号部署:
$ yum install -y kubelet-1.17.0 kubeadm-1.17.0 kubectl-1.17.0
$ systemctl enable kubelet
5. 部署Kubernetes Master
在192.168.231.132(Master)执行。
$ kubeadm init
–apiserver-advertise-address=192.168.231.132
–image-repository registry.aliyuncs.com/google_containers
–kubernetes-version v1.17.0
–service-cidr=198.36.0.0/16
–pod-network-cidr=192.72.0.0/16
期间init有报错,重置kubeadm命令:
kubeadm reset
此步要记录下生成的join命令,node节点加入时使用
由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址。
使用kubectl工具:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown ( i d − u ) : (id -u): (idu):(id -g) $HOME/.kube/config
$ kubectl get nodes
6. 安装Pod网络插件(CNI)
以下命令一般下载不到该镜像,该镜像已经在百度网盘中了,docker load后下载yml修改相关镜像名执行即可
$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
确保能够访问到quay.io这个registery。
如果Pod镜像下载失败,可以改成这个镜像地址:lizhenliang/flannel:v0.11.0-amd64
下载失败的清除方案:
删除yaml安装的组件
找到最初安装flannel时的yaml文件:
kubectl delete -f kube-flannel.yml
在所有master、worker节点上执行:
ip link delete cni0
ip link delete flannel.1
rm -rf /var/lib/cni/
rm -f /etc/cni/net.d/*
7. 加入Kubernetes Node
在192.168.31.62/63(Node)执行。
向集群添加新节点,执行在kubeadm init输出的kubeadm join命令:
$ kubeadm join 192.168.31.61:6443 --token esce21.q6hetwm8si29qxwn
–discovery-token-ca-cert-hash sha256:00603a05805807501d7181c3d60b478788408cfe6cedefedb1f97569708be9c5
8. 测试kubernetes集群
在Kubernetes集群中创建一个pod,验证是否正常运行:
$ kubectl create deployment nginx --image=nginx
$ kubectl expose deployment nginx --port=80 --type=NodePort
$ kubectl get pod,svc
访问地址:http://NodeIP:Port
9. 部署 Dashboard
以下命令一般下载不到该镜像,该镜像已经在百度网盘中了,下载yaml修改执行即可
$ kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0-beta8/aio/deploy/recommended.yaml
默认Dashboard只能集群内部访问,修改Service为NodePort类型,暴露到外部:
kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
type: NodePort
ports:
- port: 443
targetPort: 8443
nodePort: 30001
selector:
k8s-app: kubernetes-dashboard
访问地址:http://NodeIP:30001
创建service account并绑定默认cluster-admin管理员集群角色:
kubectl create serviceaccount dashboard-admin -n kube-system
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk ‘/dashboard-admin/{print $1}’)

问题:安装dashboard时出现secret “kubernetes-dashboard-certs” not found
在安装过程中,不用停止或删除安装,手动生成kubernetes-dashboard-certs证书
cd /etc/kubernetes/pki/
openssl req -new -key dashboard.key -out dashboard.csr -subj “/O=HTI/CN=kubernetes-dashboard”
openssl x509 -req -in dashboard.csr -CA ca.crt -CAkey ca.key -CAcreateserial -out dashboard.crt -days 3650
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.crt --from-file=dashboard.key -n kubernetes-dashboard
或者
mkdir key && cd key
#生成证书
openssl genrsa -out dashboard.key 2048
openssl req -new -out dashboard.csr -key dashboard.key -subj ‘/CN=192.168.231.132’
openssl x509 -req -in dashboard.csr -signkey dashboard.key -out dashboard.crt
#删除原有的证书secret
kubectl delete secret kubernetes-dashboard-certs -n kubernetes-dashboard
#创建新的证书secret
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.key --from-file=dashboard.crt -n kubernetes-dashboard
#查看pod
kubectl get pod -n kubernetes-dashboard

两种方案最后都需要重启pod
kubectl delete pod -n kubernetes-dashboard

问题:Readiness probe failed: Get http://192.168.136.38:8080/health: dial tcp 192.168.136.38:8080: connect: connection refused
1.可能是jvm内存超过了k8s的deployment配置上限
2.有可能是生存探针和就绪探针初始化时间早于docker内部项目启动完毕时间

备记:
重启kubelet
systemctl restart kubelet

查看某pod启动详情
kubectl describe pod ${pods_name} -n kube-system

查看目前启动的所有系统pod
kubectl get pods -n kube-system

类似Https 503报错
先从describe 详情探针开始查,如果是探针提示探测失败,然后查到springboot的健康检查是否为down,如果down就检查哪个项目是down

进入pod
kubectl exec -ti -n – /bin/sh

完全删除pod
kubectl get pod -n nginx
kubectl delete deployment {deploymentName} -n cxy
kubectl delete pod nginx-8698b5449c-grbdm
删除服务
kubectl delete service nginx

pod容器扩容(不推荐的方式)
kubectl scale deployment nginx --replicas=3

获取所有的命名空间
kubectl get namespace

获取服务
kubectl get svc = kubectl get service

若没有设置开机启动项,则开机需启动:
swapoff -a
systemctl start docker
systemctl start kubelet

kubelet出现问题查错命令:
journalctl -xefu kubelet

ImagePullBackOff错误多半是镜像拉取不到的问题:
1.通过yml文件delete之后重新apply
2.第一步未成功后检查kubectl describe pod ${pods_name} -n kube-system详情

yaml中:
imagePullPolicy: Always //镜像的拉取策略,总是拉取
IfNotPresent :如果本地存在镜像就优先使用本地镜像。
Never:直接不再去拉取镜像了,使用本地的;如果本地不存在就报异常了。
参数的作用范围:
.spec: 
.  containers: 
.    - name: nginx 
.      image: image: reg.docker.lc/share/nginx:latest 
.      imagePullPolicy: IfNotPresent   #或者使用Never 
 
因为此参数默认为:imagePullPolicy: Always ,如果你yaml配置文件中没有定义那就是使用默认的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值