云原生（第二篇）k8s-二进制搭建

小虾米@

已于 2023-06-30 11:43:21 修改

阅读量1.4k

点赞数

分类专栏： k8s 文章标签： kubernetes 容器云原生

于 2023-06-29 15:23:16 首次发布

本文链接：https://blog.csdn.net/y_ht1209/article/details/131448939

版权

k8s 专栏收录该内容

5 篇文章

订阅专栏

准备五台机器：

master01：192.168.169.10

node01：192.168.169.40

node02：192.168.169.50

master02：192.168.169.60

负载均衡nginx+keepalive01（master）：192.168.169.20

负载均衡nginx+keepalive01（master）：192.168.169.30

前期准备：

1、关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

2、关闭selinux
setenforce 0
sed -i 's/enforcing/disabled/' /etc/selinux/config

3、关闭swap
swapoff -a
sed -ri 's/.*swap.*/#&/' /etc/fstab

4、根据规划设置主机名
hostnamectl set-hostname master01
hostnamectl set-hostname node01
hostnamectl set-hostname node02

5、在master添加hosts
cat >> /etc/hosts << EOF
192.168.169.10 master01
192.168.169.40 node01
192.168.169.50 node02
192.168.169.60 master02
EOF

6、调整内核参数
cat > /etc/sysctl.d/k8s.conf << EOF
#开启网桥模式，可将网桥的流量传递给iptables链
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
#关闭ipv6协议
net.ipv6.conf.all.disable_ipv6=1
net.ipv4.ip_forward=1
EOF

sysctl --system

7、时间同步
yum install ntpdate -y
ntpdate time.windows.com

8、node节点安装docker

安装依赖包
yum install -y yum-utils device-mapper-persistent-data lvm2

设置阿里云镜像源
yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

安装 Docker-CE并设置为开机自动启动
yum install -y docker-ce docker-ce-cli containerd.io

tar zxvf docker-19.03.9.tgz
mv docker/* /usr/bin

cat > /usr/lib/systemd/system/docker.service << EOF
[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target

[Service]
Type=notify
ExecStart=/usr/bin/dockerd
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=infinity
LimitNPROC=infinity
LimitCORE=infinity
TimeoutStartSec=0
Delegate=yes
KillMode=process
Restart=on-failure
StartLimitBurst=3
StartLimitInterval=60s

[Install]
WantedBy=multi-user.target
EOF

systemctl start docker.service
systemctl enable docker.service

部署etcd：

准备cfssl证书生成工具

wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64 -O /usr/local/bin/cfssl
wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64 -O /usr/local/bin/cfssljson
wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64 -O /usr/local/bin/cfssl-certinfo

或者提前下载好上传

chmod +x /usr/local/bin/cfssl*

生成Etcd证书

mkdir /opt/k8s
cd /opt/k8s/

上传 etcd-cert.sh 和 etcd.sh 到 /opt/k8s/ 目录中
chmod +x etcd-cert.sh etcd.sh

创建用于生成CA证书、etcd 服务器证书以及私钥的目录
mkdir /opt/k8s/etcd-cert
mv etcd-cert.sh etcd-cert/
cd /opt/k8s/etcd-cert/
先修改etcd-cert.sh的IP地址
./etcd-cert.sh #生成CA证书、etcd 服务器证书以及私钥

上传 etcd-v3.4.26-linux-amd64.tar.gz 到 /opt/k8s 目录中，启动etcd服务
cd /opt/k8s/
tar zxvf etcd-v3.4.26-linux-amd64.tar.gz

创建用于存放 etcd 配置文件，命令文件，证书的目录
mkdir -p /opt/etcd/{cfg,bin,ssl}

cd /opt/k8s/etcd-v3.4.26-linux-amd64/
mv etcd etcdctl /opt/etcd/bin/
cp /opt/k8s/etcd-cert/*.pem /opt/etcd/ssl/

cd /opt/k8s/
./etcd.sh etcd01 192.168.169.10 etcd02=https://192.168.169.40:2380,etcd03=https://192.168.169.50:2380

可另外打开一个窗口查看etcd进程是否正常
ps -ef | grep etcd

把etcd相关证书文件、命令文件和服务管理文件全部拷贝到另外两个etcd集群节点
scp -r /opt/etcd/ root@192.168.169.40:/opt/
scp -r /opt/etcd/ root@192.168.169.50:/opt/
scp /usr/lib/systemd/system/etcd.service root@192.168.169.40:/usr/lib/systemd/system/
scp /usr/lib/systemd/system/etcd.service root@192.168.169.50:/usr/lib/systemd/system/

在 node01 节点上，修改节点etcd的配置信息：

启动etcd服务：

systemctl start etcd
systemctl enable etcd
systemctl status etcd

检查etcd群集状态
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.169.10:2379,https://192.168.169.40:2379,https://192.168.169.50:2379" endpoint health --write-out=table

ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.169.10:2379,https://192.168.169.40:2379,https://192.168.169.50:2379" --write-out=table member list

部署master组件：

在 master01 节点上操作：
上传 master.zip 和 k8s-cert.sh 到 /opt/k8s 目录中，解压 master.zip 压缩包
cd /opt/k8s/
unzip master.zip
chmod +x *.sh

创建kubernetes工作目录
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}

创建用于生成CA证书、相关组件的证书和私钥的目录
mkdir /opt/k8s/k8s-cert
mv /opt/k8s/k8s-cert.sh /opt/k8s/k8s-cert
cd /opt/k8s/k8s-cert/
先修改k8s-cert.sh里面的ip配置，并且把注释删除
./k8s-cert.sh #生成CA证书、相关组件的证书和私钥

出现这样就成功了：

复制CA证书、apiserver相关证书和私钥到 kubernetes工作目录的 ssl 子目录中
cp ca*pem apiserver*pem /opt/kubernetes/ssl/

上传 kubernetes-server-linux-amd64.tar.gz 到 /opt/k8s/ 目录中，解压 kubernetes 压缩包
cd /opt/k8s/
tar zxvf kubernetes-server-linux-amd64.tar.gz

复制master组件的关键命令文件到 kubernetes工作目录的 bin 子目录中
cd /opt/k8s/kubernetes/server/bin
cp kube-apiserver kubectl kube-controller-manager kube-scheduler /opt/kubernetes/bin/
ln -s /opt/kubernetes/bin/* /usr/local/bin/

创建 bootstrap token 认证文件，apiserver 启动时会调用，然后就相当于在集群内创建了一个这个用户，接下来就可以用 RBAC 给他授权
cd /opt/k8s/
head -c 16 /dev/urandom | od -An -t x | tr -d ' ' 得到一串字符

vim /opt/kubernetes/cfg/token.csv

3afddd453b4c7df7d1c29052bcb2504c,kubelet-bootstrap,10001,"system:kubelet-bootstrap"

chmod +x token.sh

./token.sh

二进制文件、token、证书都准备好后，开启 apiserver 服务

cd /opt/k8s/
./apiserver.sh 192.168.169.10 https://192.168.169.40:2379,https://192.168.169.50:2379,https://192.168.169.10:2379

检查进程是否启动成功
ps aux | grep kube-apiserver

netstat -natp | grep 6443 #安全端口6443用于接收HTTPS请求，用于基于Token文件或客户端证书等认证

启动 scheduler 服务

cd /opt/k8s/
修改scheduler.sh的ip
./scheduler.sh
ps aux | grep kube-scheduler

启动 controller-manager 服务
修改controller-manager.sh的ip
./controller-manager.sh
ps aux | grep kube-controller-manager

生成kubectl连接集群的kubeconfig文件
修改admin.sh的ip
./admin.sh

绑定默认cluster-admin管理员集群角色，授权kubectl访问集群
kubectl create clusterrolebinding cluster-system-anonymous --clusterrole=cluster-admin --user=system:anonymous

通过kubectl工具查看当前集群组件状态
kubectl get cs

查看版本信息
kubectl version

部署node组件：

创建kubernetes工作目录：
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}

上传 node.zip 到 /opt 目录中，解压 node.zip 压缩包，获得kubelet.sh、proxy.sh
cd /opt/
unzip node.zip
chmod +x kubelet.sh proxy.sh

在 master01 节点上操作：

把 kubelet、kube-proxy 拷贝到 node 节点
cd /opt/k8s/kubernetes/server/bin
scp kubelet kube-proxy root@192.168.169.40:/opt/kubernetes/bin/
scp kubelet kube-proxy root@192.168.169.50:/opt/kubernetes/bin/

上传kubeconfig.sh文件到/opt/k8s/kubeconfig目录中，生成kubelet初次加入集群引导kubeconfig文件和kube-proxy.kubeconfig文件

mkdir /opt/k8s/kubeconfig
cd /opt/k8s/kubeconfig
chmod +x kubeconfig.sh
./kubeconfig.sh 192.168.169.10 /opt/k8s/k8s-cert/

把配置文件 bootstrap.kubeconfig、kube-proxy.kubeconfig 拷贝到 node 节点
scp bootstrap.kubeconfig kube-proxy.kubeconfig root@192.168.169.40:/opt/kubernetes/cfg/
scp bootstrap.kubeconfig kube-proxy.kubeconfig root@192.168.169.50:/opt/kubernetes/cfg/

RBAC授权，使用户 kubelet-bootstrap 能够有权限发起 CSR 请求证书
kubectl create clusterrolebinding kubelet-bootstrap --clusterrole=system:node-bootstrapper --user=kubelet-bootstrap

可能出现问题：
error: failed to create clusterrolebinding: clusterrolebindings.rbac.authorization.k8s.io "kubelet-bootstrap" already exists

输入：kubectl delete clusterrolebinding kubelet-bootstrap
再次创建就好了！

在 node01 节点上操作
#启动 kubelet 服务
cd /opt/
./kubelet.sh 192.168.169.40
ps aux | grep kubelet

在 master01 节点上操作，通过 CSR 请求
#检查到 node01 节点的 kubelet 发起的 CSR 请求，Pending 表示等待集群给该节点签发证书
kubectl get csr

通过 CSR 请求
kubectl certificate approve node-csr-duiobEzQ0R93HsULoS9NT9JaQylMmid_nBF3Ei3NtFE

再次查看kubectl get csr Approved,Issued 表示已授权 CSR 请求并签发证书

查看节点，由于网络插件还没有部署，节点会没有准备就绪 NotReady

可能出现的错误：No resources found
重启node节点上的kube-let服务
在/etc/docker/daemon.json上添加{"exec-opts": ["native.cgroupdriver=systemd"]}

在 node01 节点上操作
加载 ip_vs 模块
for i in $(ls /usr/lib/modules/$(uname -r)/kernel/net/netfilter/ipvs|grep -o "^[^.]*");do echo $i; /sbin/modinfo -F filename $i >/dev/null 2>&1 && /sbin/modprobe $i;done

启动proxy服务
cd /opt/
./proxy.sh 192.168.169.40
ps aux | grep kube-proxy

部署CNI网络插件：（实现pod跨主机跨节点之间的通信）

flannel和calico区别？

①模式不同，flannel是udp hostgw vxlan calico是ipip bgp 混合

②网段不同，flannel是10.244.0.0/16 calico是192.168.0.0/16

③flannel vxlan采用的是网络叠加，通过ip隧道方式传输数据，可以跨子网传输数据，传输过程需要封装解封装，性能不佳，可以做简单配置功能，方便管理，不能配置复杂的网络策略规则

calico ipip 也是网络叠加模式，通过ip隧道方式传输数据，传输过程中有封装和解封装的过程，性能不佳

calico bgp模式，直接通过bgp路由直接转发，不会有封装和解封装的过程，性能最好，只在同一局域网中转发，不能跨子网转发，可以配置复杂的网络策略规则，但是维护比较麻烦

④网络策略不同，flannel不能使用网络策略，calico使用dns policy ingress policy等网络策略

flannel udp的工作原理：
应用数据通过源主机的pod发出，到cni0网桥接口，cni0在发送到flannel0中
flanneled会监听flannel0的数据变化，进行封装udp报文，暴露8285端口
然后通过flannel0在etcd中维护的路由表找到目标节点的ip，通过物理ip转发到目标主机
目标主机通过8285端口转发到flannel0上，进行解封装得到目标pod的ip，转发给cni0，在转发给pod，从而实现了pod跨节点的通信

在 node01 节点上操作：

上传 cni-plugins-linux-amd64-v0.8.6.tgz 和 flannel.tar 到 /opt 目录中
cd /opt/
docker load -i flannel.tar

mkdir /opt/cni/bin -p
tar zxvf cni-plugins-linux-amd64-v0.8.6.tgz -C /opt/cni/bin

在 master01 节点上操作：

上传 kube-flannel.yml 文件到 /opt/k8s 目录中，部署 CNI 网络
cd /opt/k8s
kubectl apply -f kube-flannel.yml

kubectl get pods -A

kubectl get nodes

部署 CoreDNS：

在所有 node 节点上操作
上传 coredns.tar 到 /opt 目录中
cd /opt
docker load -i coredns.tar

在 master01 节点上操作
上传 coredns.yaml 文件到 /opt/k8s 目录中，部署 CoreDNS
cd /opt/k8s
kubectl apply -f coredns.yaml

kubectl get pods -A

master02部署：

从 master01 节点上拷贝证书文件、各master组件的配置文件和服务管理文件到 master02 节点

scp -r /opt/etcd/ root@192.168.169.60:/opt/
scp -r /opt/kubernetes/ root@192.168.169.60:/opt
scp /usr/lib/systemd/system/{kube-apiserver,kube-controller-manager,kube-scheduler}.service root@192.168.169.60:/usr/lib/systemd/system/
scp -r /root/.kube root@192.168.169.60:/root

修改配置文件kube-apiserver中的IP
vim /opt/kubernetes/cfg/kube-apiserver
KUBE_APISERVER_OPTS="--logtostderr=true \
--v=4 \
--etcd-servers=https://192.168.80.10:2379,https://192.168.80.11:2379,https://192.168.80.12:2379 \
--bind-address=192.168.80.20 \ #修改
--secure-port=6443 \
--advertise-address=192.168.80.20 \ #修改
......

在 master02 节点上启动各服务并设置开机自启
systemctl start kube-apiserver.service
systemctl enable kube-apiserver.service
systemctl start kube-controller-manager.service
systemctl enable kube-controller-manager.service
systemctl start kube-scheduler.service
systemctl enable kube-scheduler.service

查看node节点状态
ln -s /opt/kubernetes/bin/* /usr/local/bin/
kubectl get nodes

kubectl get nodes -o wide

负载均衡部署：

配置load balancer集群双机热备负载均衡（nginx实现负载均衡，keepalived实现双机热备）
##### 在lb01、lb02节点上操作 #####
//配置nginx的官方在线yum源，配置本地nginx的yum源
cat > /etc/yum.repos.d/nginx.repo << 'EOF'
[nginx]
name=nginx repo
baseurl=http://nginx.org/packages/centos/7/$basearch/
gpgcheck=0
EOF

yum install nginx -y

修改nginx配置文件，配置四层反向代理负载均衡，指定k8s群集2台master的节点ip和6443端口
vim /etc/nginx/nginx.conf
events {
worker_connections 1024;
}

#添加
stream {
log_format main '$remote_addr $upstream_addr - [$time_local] $status $upstream_bytes_sent';

access_log /var/log/nginx/k8s-access.log main;

upstream k8s-apiserver {
server 192.168.80.10:6443;
server 192.168.80.20:6443;
}
server {
listen 6443;
proxy_pass k8s-apiserver;
}
}

http {
......

//检查配置文件语法
nginx -t

//启动nginx服务，查看已监听6443端口
systemctl start nginx
systemctl enable nginx
netstat -natp | grep nginx

部署keepalived服务：

yum install keepalived -y 可以在/opt/k8s/k8s-cert下面的k8s-cert.sh里面看具体信息

修改keepalived配置文件
vim /etc/keepalived/keepalived.conf
! Configuration File for keepalived

global_defs {
# 接收邮件地址
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
# 邮件发送地址
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id NGINX_MASTER #lb01节点的为 NGINX_MASTER，lb02节点的为 NGINX_BACKUP
}

#添加一个周期性执行的脚本
vrrp_script check_nginx {
script "/etc/nginx/check_nginx.sh" #指定检查nginx存活的脚本路径
}

vrrp_instance VI_1 {
state MASTER           #lb01节点的为 MASTER，lb02节点的为 BACKUP
interface ens33           #指定网卡名称 ens33
virtual_router_id 51   #指定vrid，两个节点要一致
priority 100           #lb01节点的为 100，lb02节点的为 90
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.80.100/24   #指定 VIP
}
track_script {
check_nginx           #指定vrrp_script配置的脚本
}
}

创建nginx状态检查脚本
vim /etc/nginx/check_nginx.sh
#!/bin/bash
#egrep -cv "grep|$$" 用于过滤掉包含grep 或者 $$ 表示的当前Shell进程ID
count=$(ps -ef | grep nginx | egrep -cv "grep|$$")

if [ "$count" -eq 0 ];then
systemctl stop keepalived
fi