一、步骤概览
对比上面架构图,部署步骤主要分为7个步:
1、创建三台虚拟机,部署linux系统(省略)
2、系统初始化
3、为etcd和apiserver自签证书
4、部署etcd集群
5、部署master,其中包括kube-apiserver,kube-controller-manager,kub-scheduler,etcd,
6、部署kubelet,kube-proxy,docker,etcd。
7、部署集群网络。
二、部署
1、创建三台虚拟机,部署linux系统,以及规划(省略)
节点 | ip | 规划 | 配置 |
---|---|---|---|
master | 192.167.25.217 | kube-apiserver, kube-controller-manager, kube-scheduler, etcd,docker | 2G,2cpu,30G硬盘,centos7.X |
node1 | 192.167.25.218 | kubelet, kube-proxy, docker,etcd | 2G,2cpu,30G硬盘,centos7.X |
node2 | 192.167.25.219 | kubelet, kube-proxy, docker,etcd | 2G,2cpu,30G硬盘,centos7.X |
2、系统初始化
2-1 禁用防火墙,selinux,关闭swap(master和node节点都需要设置)
# 关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
# 关闭selinux
sed -i 's/enforcing/disabled/' /etc/selinux/config # 永久
setenforce 0 # 临时
# 关闭swap
swapoff -a # 临时
sed -ri 's/.*swap.*/#&/' /etc/fstab # 永久
2-2 设置每台服务器主机名,添加host文件。
通过hostnamem命令查询主机名字
# hostname
k8smaster
通过设置主机名称:
# 根据规划设置主机名
hostnamectl set-hostname <hostname>
1、设置注解192.168.25.217注解名称:
hostnamectl set-hostname k8smaster
2、设置注解192.168.25.218注解名称:
hostnamectl set-hostname k8snode1
3、设置注解192.168.25.219注解名称:
hostnamectl set-hostname k8snode2
在master添加hosts(注意:仅需在master节点添加即可。)
cat >> /etc/hosts << EOF
192.168.25.217 k8smaster
192.168.25.218 k8snode1
192.168.25.219 k8snode2
EOF
2-3将桥接的IPv4流量传递到iptables的链(master和node节点都需要设置)
cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sysctl --system # 让配置生效
2-4 同步时间(master和node节点都需要设置)
如果时间不同步,会导致docker下载失败。
# 查看时区:
ls -l /etc/localtime
# 修改时区
sudo rm -f /etc/localtime
sudo ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
# 时间同步
yum install ntpdate -y
ntpdate time.windows.com
2-5 安装必备软件
yum install -y wget vim lrzsz unzip net-tools
2-6 安装docker
master 节点也需要安装docker,因为后面安装CNI 的时候,需要用到docker。
wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
yum -y install docker-ce-19.03.9-3.el7
systemctl enable docker && systemctl start docker
docker --version
设置docker下载镜像加速器:
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<-'EOF'
{
"registry-mirrors": ["https://w2hvqdzg.mirror.aliyuncs.com"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
到此,三个机器的初始化完成了。
3、为etcd和apiserver自签证书
k8s 所有组件都是 采用https加密通信的,这些组件一般有两套根证书生成:k8s 组件(apiserver)和etcd。
红色线:k8s 自建证书颁发机构(CA),需要携带有它生成的客户端证书访问apiserver。
蓝色线:etcd 自建证书颁发机构(CA),需要携带它颁发的客户端证书访问etcd。
3.1 准备 cfssl 证书生成工具
cfssl 是一个开源的证书管理工具, 使用 json 文件生成证书, 相比 openssl 更方便使用。
找任意一台服务器操作, 这里用 Master 节点。
如果cfssl_linux-amd64,cfssljson_linux-amd64,cfssl-certinfo_linux-amd64文件下载慢,可以直接下载我上传到csdn中的资源。https://download.csdn.net/download/aiming66/37698646
# 下载相关工具:
wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64
wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64
wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64
chmod +x cfssl_linux-amd64 cfssljson_linux-amd64 cfssl-certinfo_linux-amd64
mv cfssl_linux-amd64 /usr/local/bin/cfssl
mv cfssljson_linux-amd64 /usr/local/bin/cfssljson
mv cfssl-certinfo_linux-amd64 /usr/bin/cfssl-certinfo
3.2 生成 Etcd 证书
3.2.1自签证书颁发机构( CA)
创建工作目录:
mkdir -p ~/TLS/{etcd,k8s}
cd ~/TLS/etcd
自签 CA:
cat > ca-config.json<< EOF
{
"signing":{
"default":{
"expiry":"87600h"
},
"profiles":{
"www":{
"expiry":"87600h",
"usages":[
"signing",
"key encipherment",
"server auth",
"client auth"
]
}
}
}
}
EOF
cat > ca-csr.json<< EOF
{
"CN":"etcd CA",
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"Beijing",
"ST":"Beijing"
}
]
}
EOF
生成证书:
#初始化证书
cfssl gencert -initca ca-csr.json | cfssljson -bare ca -
然后我们看一下是否生产跟证书成功,有了这个跟根证书,就可以为etcd颁发域名证书了。
[root@k8smaster etcd]# ls *.pem
ca-key.pem ca.pem
3.2.2使用自签 CA 签发 Etcd HTTPS 证书
创建证书申请文件:
cat > server-csr.json<< EOF
{
"CN":"etcd",
"hosts":[
"192.168.25.217",
"192.168.25.218",
"192.168.25.219"
],
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"BeiJing",
"ST":"BeiJing"
}
]
}
EOF
注: 上述文件 hosts 字段中 IP 为所有 etcd 节点的集群内部通信 IP, 一个都不能少! 为了方便后期扩容可以多写几个预留的 IP。
生成证书:
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=www server-csr.json | cfssljson -bare server
# 查看生产的证书
ls server*pem
server-key.pem server.pem
到此证书正常完毕。
4、部署etcd集群
Etcd 是一个分布式键值存储系统, Kubernetes 使用 Etcd 进行数据存储; 为解决 Etcd 单点故障, 在生产中采用集群方式部署,避免 Etcd 单点故障, 这里使用 3 台组建集群, 可容忍 1 台机器故障, 如果使用 5 台组建集群, 可容忍 2 台机器故障。生产环境建议单独服务器部署这些etcd节点。
etcd节点规划
节点 | ip |
---|---|
etcd1 | 192.167.25.217 |
etcd2 | 192.167.25.218 |
etcd3 | 192.167.25.219 |
下载etcd。
下载地址:https://github.com/etcd-io/etcd/releases/download/v3.4.9/etcd-v3.4.9-linux-amd64.tar.gz
或者从csdn下载:https://download.csdn.net/download/aiming66/38028629
4.1 部署 Etcd 集群
以下在节点 1 上操作, 为简化操作, 待会将节点 1 生成的所有文件拷贝到节点 2 和节点 3.
(1) 创建工作目录并解压二进制包
mkdir /opt/etcd/{bin,cfg,ssl} -p
tar zxvf etcd-v3.4.9-linux-amd64.tar.gz
mv etcd-v3.4.9-linux-amd64/{etcd,etcdctl} /opt/etcd/bin/
(2)拷贝刚才生成的证书
把刚才生成的证书拷贝到配置文件中的路径:
cp ~/TLS/etcd/ca*pem ~/TLS/etcd/server*pem /opt/etcd/ssl/
(3)创建 etcd 配置文件
cat > /opt/etcd/cfg/etcd.conf << EOF
#[Member]
ETCD_NAME="etcd-1"
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://192.168.25.217:2380"
ETCD_LISTEN_CLIENT_URLS="https://192.168.25.217:2379"
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.25.217:2380"
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.25.217:2379"
ETCD_INITIAL_CLUSTER="etcd-1=https://192.168.25.217:2380,etcd-2=https://192.168.25.218:2380,etcd-3=https://192.168.25.219:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"
EOF
ETCD_NAME: 节点名称, 集群中唯一
ETCD_DATA_DIR: 数据目录
ETCD_LISTEN_PEER_URLS: 集群通信监听地址
ETCD_LISTEN_CLIENT_URLS: 客户端访问监听地址,也就是当前机器的ip地址,
ETCD_INITIAL_ADVERTISE_PEER_URLS: 集群通告地址
ETCD_ADVERTISE_CLIENT_URLS: 客户端通告地址
ETCD_INITIAL_CLUSTER: 集群节点地址,需要将每个etcd节点的ip和端口都写上。
ETCD_INITIAL_CLUSTER_TOKEN: 集群 Token
ETCD_INITIAL_CLUSTER_STATE: 加入集群的当前状态, new 是新集群, existing 表示加入已有集群
(4)通过 scp命令将/opt/etcd 文件夹和/usr/lib/systemd/system/etcd.service复制到etcd节点的/opt 路径下和/usr/lib/systemd/system/下。
scp -r /opt/etcd/ root@192.168.25.218:/opt/
scp -r /opt/etcd/ root@192.168.25.219:/opt/
(5)然后在etcd节点 2 和节点 3 分别修改 etcd.conf 配置文件中的节点名称和当前服务器 IP:
vi /opt/etcd/cfg/etcd.conf
#[Member]
ETCD_NAME="etcd-3" # 修改此处, 节点 2 改为 etcd-2, 节点 3 改为 etcd-3
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://192.168.25.219:2380" # 修改此处为当前服务器 IP
ETCD_LISTEN_CLIENT_URLS="https://192.168.25.219:2379" # 修改此处为当前服务器 IP
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.25.219:2380" # 修改此处为当前
服务器 IP
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.25.219:2379" # 修改此处为当前服务器
IP
ETCD_INITIAL_CLUSTER="etcd-1=https://192.168.25.217:2380,etcd-2=https://192.168.25.218:2380,etcd-3=https://192.168.25.219:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"
(6)在三台配置systemd管理etcd。
cat > /usr/lib/systemd/system/etcd.service << EOF
[Unit]
Description=Etcd Server
After=network.target
After=network-online.target
Wants=network-online.target
[Service]
Type=notify
EnvironmentFile=/opt/etcd/cfg/etcd.conf
ExecStart=/opt/etcd/bin/etcd \
--cert-file=/opt/etcd/ssl/server.pem \
--key-file=/opt/etcd/ssl/server-key.pem \
--peer-cert-file=/opt/etcd/ssl/server.pem \
--peer-key-file=/opt/etcd/ssl/server-key.pem \
--trusted-ca-file=/opt/etcd/ssl/ca.pem \
--peer-trusted-ca-file=/opt/etcd/ssl/ca.pem \
--logger=zap
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
(7)在三台etcd节点上启动并设置etcd开机启动
systemctl daemon-reload
systemctl start etcd
systemctl enable etcd
(8)查看集群状态
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.25.217:2379,https://192.168.25.218:2379,https://192.168.25.219:2379" endpoint health --write-out=table
当显示如下文字,则代表启动正常了。
https://192.168.25.217:2379 is healthy: successfully committed proposal: took = 17.981708ms
https://192.168.25.218:2379 is healthy: successfully committed proposal: took = 18.184562ms
https://192.168.25.219:2379 is healthy: successfully committed proposal: took = 23.537695ms
如果输出上面信息, 就说明集群部署成功。 如果有问题第一步先看日志:/var/log/message 或 journalctl -u etcd,或者journalctl -u etcd -f 实时查看日志。
到此etcd集群部署成功~
5、部署master,其中包括kube-apiserver,kube-controller-manager,kub-scheduler,etcd(已部署)。
5.1 安装自签证书
因为安装apiserver,需要做一个自签证书,从而可以让apiserver通过https访问node节点。下面我们先生成apiserver的自签证书。
(1)自签证书颁发机构(ca)
cd /root/TLS/k8s
cat > ca-config.json<< EOF
{
"signing":{
"default":{
"expiry":"87600h"
},
"profiles":{
"kubernetes":{
"expiry":"87600h",
"usages":[
"signing",
"key encipherment",
"server auth",
"client auth"
]
}
}
}
}
EOF
cat > ca-csr.json<< EOF
{
"CN":"kubernetes",
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"Beijing",
"ST":"Beijing",
"O":"k8s",
"OU":"System"
}
]
}
EOF
(2)生成证书
cfssl gencert -initca ca-csr.json | cfssljson -bare ca -
ls *pem
ca-key.pem ca.pem
(3)使用自签 CA 签发 kube-apiserver HTTPS 证书
创建证书申请文件:
为了方便我们后面将单master扩展为多master集群,我们在hosts 数组中添加两个ip,作为备用: 192.168.25.220,192.168.25.221
cd ~/TLS/k8s
cat > server-csr.json<< EOF
{
"CN":"kubernetes",
"hosts":[
"10.0.0.1",
"127.0.0.1",
"192.168.25.217",
"192.168.25.218",
"192.168.25.219",
"192.168.25.220",
"192.168.25.221",
"kubernetes",
"kubernetes.default",
"kubernetes.default.svc",
"kubernetes.default.svc.cluster",
"kubernetes.default.svc.cluster.local"
],
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"BeiJing",
"ST":"BeiJing",
"O":"k8s",
"OU":"System"
}
]
}
EOF
(4)生成证书:
#生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes server-csr.json | cfssljson -bare server
# 查看生产的证书
ls server*pem
server-key.pem server.pem
5.2 下载k8s
通过链接https://github.com/kubernetes/kubernetes/tree/master/CHANGELOG,可以查询k8s 的各个版本。
我们今天主要以K8s-v1.20.4版本为例演示。
然后将我们下载的kubernetes-server-linux-amd64.tar.gz 包上传到master节点中。
# 解压安装包
tar -zxvf kubernetes-server-linux-amd64.tar.gz
# 所有文件都在/server/bin 路径下
cd kubernetes/server/bin
部署master主要需要图上这些文件,kube-apiserver,kube-controller-manager,kubectl,kube-scheduler。
创建k8s master 安装文件夹
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}
将master 节点的相关执行文件拷贝到对应目录:
cp kube-apiserver kube-scheduler kube-controller-manager /opt/kubernetes/bin
cp kubectl /usr/bin/
5.3 部署 kube-apiserver
(1)拷贝刚才生成apiserver认证的证书
cp ~/TLS/k8s/ca*pem ~/TLS/k8s/server*pem /opt/kubernetes/ssl/
(2)创建apiserver配置文件
cat > /opt/kubernetes/cfg/kube-apiserver.conf << EOF
KUBE_APISERVER_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/opt/kubernetes/logs \\
--etcd-servers=https://192.168.25.217:2379,https://192.168.25.218:2379,https://192.168.25.219:2379 \\
--bind-address=192.168.25.217 \\
--secure-port=6443 \\
--advertise-address=192.168.25.217 \\
--allow-privileged=true \\
--service-cluster-ip-range=10.0.0.0/24 \\
--enable-admission-plugins=NamespaceLifecycle,LimitRanger,ServiceAccount,ResourceQuota,NodeRestriction \\
--authorization-mode=RBAC,Node \\
--enable-bootstrap-token-auth=true \\
--token-auth-file=/opt/kubernetes/cfg/token.csv \\
--service-node-port-range=30000-32767 \\
--kubelet-client-certificate=/opt/kubernetes/ssl/server.pem \\
--kubelet-client-key=/opt/kubernetes/ssl/server-key.pem \\
--tls-cert-file=/opt/kubernetes/ssl/server.pem \\
--tls-private-key-file=/opt/kubernetes/ssl/server-key.pem \\
--client-ca-file=/opt/kubernetes/ssl/ca.pem \\
--service-account-key-file=/opt/kubernetes/ssl/ca-key.pem \\
--service-account-issuer=api \\
--service-account-signing-key-file=/opt/kubernetes/ssl/server-key.pem \\
--etcd-cafile=/opt/etcd/ssl/ca.pem \\
--etcd-certfile=/opt/etcd/ssl/server.pem \\
--etcd-keyfile=/opt/etcd/ssl/server-key.pem \\
--requestheader-client-ca-file=/opt/kubernetes/ssl/ca.pem \\
--proxy-client-cert-file=/opt/kubernetes/ssl/server.pem \\
--proxy-client-key-file=/opt/kubernetes/ssl/server-key.pem \\
--requestheader-allowed-names=kubernetes \\
--requestheader-extra-headers-prefix=X-Remote-Extra- \\
--requestheader-group-headers=X-Remote-Group \\
--requestheader-username-headers=X-Remote-User \\
--enable-aggregator-routing=true \\
--audit-log-maxage=30 \\
--audit-log-maxbackup=3 \\
--audit-log-maxsize=100 \\
--audit-log-path=/opt/kubernetes/logs/k8s-audit.log"
EOF
注: 上面两个\ 第一个是转义符, 第二个是换行符, 使用转义符是为了使用 EOF 保留换行符。
• --logtostderr:启用日志
• —v:日志等级
• --log-dir:日志目录
• --etcd-servers:etcd集群地址
• --bind-address:监听地址
• --secure-port:https安全端口
• --advertise-address:集群通告地址
• --allow-privileged:启用授权
• --service-cluster-ip-range:Service虚拟IP地址段
• --enable-admission-plugins:准入控制模块
• --authorization-mode:认证授权,启用RBAC授权和节点自管理
• --enable-bootstrap-token-auth:启用TLS bootstrap机制
• --token-auth-file:bootstrap token文件
• --service-node-port-range:Service nodeport类型默认分配端口范围
• --kubelet-client-xxx:apiserver访问kubelet客户端证书
• --tls-xxx-file:apiserver https证书
• 1.20版本必须加的参数:–service-account-issuer,–service-account-signing-key-file
• --etcd-xxxfile:连接Etcd集群证书
• --audit-log-xxx:审计日志
• 启动聚合层相关配置:–requestheader-client-ca-file,–proxy-client-cert-file,–proxy-client-key-file,–requestheader-allowed-names,–requestheader-extra-headers-prefix,–requestheader-group-headers,–requestheader-username-headers,–enable-aggregator-routin
(3). 启用 TLS Bootstrapping 机制
TLS Bootstraping: Master apiserver 启用 TLS 认证后, Node 节点 kubelet 和 kubeproxy 要与 kube-apiserver 进行通信, 必须使用 CA 签发的有效证书才可以, 当 Node节点很多时, 这种客户端证书颁发需要大量工作, 同样也会增加集群扩展复杂度。 为了简化流程, Kubernetes 引入了 TLS bootstraping 机制来自动颁发客户端证书, kubelet会以一个低权限用户自动向 apiserver 申请证书, kubelet 的证书由 apiserver 动态签署。
所以强烈建议在 Node 上使用这种方式, 目前主要用于 kubelet, kube-proxy 还是由我
们统一颁发一个证书。
TLS bootstraping 工作流程:
创建上述配置文件中 token 文件:
cat > /opt/kubernetes/cfg/token.csv << EOF
fb69c54a1cbcd419b668cf8418c3b8cd,kubelet-bootstrap,10001,"system:node-bootstrapper"
EOF
格式: token, 用户名, UID, 用户组
token 也可自行生成替换:
head -c 16 /dev/urandom | od -An -t x | tr -d ' '
(4)systemd 管理 apiserver
cat > /usr/lib/systemd/system/kube-apiserver.service << EOF
[Unit]
Description=Kubernetes API Server
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-apiserver.conf
ExecStart=/opt/kubernetes/bin/kube-apiserver \$KUBE_APISERVER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
(5)启动apiserver
#kube-apiserver启动并设置开机启动
systemctl daemon-reload
systemctl start kube-apiserver
systemctl enable kube-apiserver
到此apiserver安装完成。接下来我们来部署scheduler和controller-manager
通过上图,我们可以了解到,scheduler和controller-manager 也是借助https链接apiserver的的6443 端口,scheduler和controller-manager 链接apiserver的时候,需要有一个身份:kubeconfig。也就是说scheduler和controller-manager 是通过kubeconfig 文件来链接apiserver的。同样的,kubelet和kube-proxy也是通过kubeconfig来链接apiserver的。
备注:kubeconfig是链接k8s 集群的一个配置文件,需要我们手动生动的。
我们先配置scheduler和controller-manager程序,然后在配置kubeconfig文件。
授权 kubelet-bootstrap 用户允许请求证书
这一步主要是为后面添加work node节点做准备,让刚才我们上面的token 文件中的用户并,绑定到角色node-bootstrapper,从可以让work node 以token 文件中的用户带着node-bootstrapper角色最小权限的访问apiserver。
kubectl create clusterrolebinding kubelet-bootstrap \
--clusterrole=system:node-bootstrapper \
--user=kubelet-bootstrap
5.4 部署kube-controller-manager
(1)创建kube-controller-manager 的配置文件:
cat > /opt/kubernetes/cfg/kube-controller-manager.conf << EOF
KUBE_CONTROLLER_MANAGER_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/opt/kubernetes/logs \\
--leader-elect=true \\
--kubeconfig=/opt/kubernetes/cfg/kube-controller-manager.kubeconfig \\
--bind-address=127.0.0.1 \\
--allocate-node-cidrs=true \\
--cluster-cidr=10.244.0.0/16 \\
--service-cluster-ip-range=10.0.0.0/24 \\
--cluster-signing-cert-file=/opt/kubernetes/ssl/ca.pem \\
--cluster-signing-key-file=/opt/kubernetes/ssl/ca-key.pem \\
--root-ca-file=/opt/kubernetes/ssl/ca.pem \\
--service-account-private-key-file=/opt/kubernetes/ssl/ca-key.pem \\
--experimental-cluster-signing-duration=87600h0m0s"
EOF
– kubeconfi:链接apiserver的配置文件
– leader-elect: 当该组件启动多个时, 自动选举( HA)
– cluster-signing-cert-file/– cluster-signing-key-file: 自动为 kubelet 颁发证书的 CA, 与 apiserver 保持一致
(2) 生成kube-controller-manager.kubeconfig
# 切换目录
cd ~/TLS/k8s/
# 创建证书请求文件
cat > kube-controller-manager-csr.json << EOF
{
"CN": "system:kube-controller-manager",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "system:masters",
"OU": "System"
}
]
}
EOF
# 生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-controller-manager-csr.json | cfssljson -bare kube-controller-manager
生成kubeconfig 文件
#切换到刚才生成kube-controller-manager证书地方
cd ~/TLS/k8s/
# 设置环境变量KUBE_CONFIG
KUBE_CONFIG="/opt/kubernetes/cfg/kube-controller-manager.kubeconfig"
#配置环境变量KUBE_APISERVER
KUBE_APISERVER="https://192.168.25.217:6443" # apiserver IP:PORT
kubectl config set-cluster kubernetes \
--certificate-authority=/opt/kubernetes/ssl/ca.pem \
--embed-certs=true \
--server=${KUBE_APISERVER} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-controller-manager \
--client-certificate=./kube-controller-manager.pem \
--client-key=./kube-controller-manager-key.pem \
--embed-certs=true \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \
--cluster=kubernetes \
--user=kube-controller-manager \
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
通过命令查看kube-controller-manager.kubeconfig是否生成成功:
ll /opt/kubernetes/cfg/kube-controller-manager.kubeconfig
(3)systemd 管理 controller-manager
cat > /usr/lib/systemd/system/kube-controller-manager.service << EOF
[Unit]
Description=Kubernetes Controller Manager
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-controller-manager.conf
ExecStart=/opt/kubernetes/bin/kube-controller-manager \$KUBE_CONTROLLER_MANAGER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
(4) 启动controller-manager,并设置开机自启动
#kube-controller-manager启动并设置开机启动
systemctl daemon-reload
systemctl start kube-controller-manager
systemctl enable kube-controller-manager
systemctl status kube-controller-manager
5.5 部署kube-scheduler
(1) 创建kube-scheduler配置文件
cat > /opt/kubernetes/cfg/kube-scheduler.conf << EOF
KUBE_SCHEDULER_OPTS="--logtostderr=false \
--v=2 \
--log-dir=/opt/kubernetes/logs \
--leader-elect \
--kubeconfig=/opt/kubernetes/cfg/kube-scheduler.kubeconfig \\
--bind-address=127.0.0.1"
EOF
– leader-elect: 当该组件启动多个时, 自动选举( HA)
– kubeconfi:链接apiserver的配置文件
(2) 生成kube-scheduler.kubeconfig
# 切换目录
cd ~/TLS/k8s/
# 创建证书请求文件
cat > kube-scheduler-csr.json << EOF
{
"CN": "system:kube-scheduler",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "system:masters",
"OU": "System"
}
]
}
EOF
# 生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-scheduler-csr.json | cfssljson -bare kube-scheduler
生成kubeconfig 文件
#切换到刚才生成kube-scheduler 证书地方
cd ~/TLS/k8s/
# 设置环境变量KUBE_CONFIG
KUBE_CONFIG="/opt/kubernetes/cfg/kube-scheduler.kubeconfig"
#配置环境变量KUBE_APISERVER
KUBE_APISERVER="https://192.168.25.217:6443" # apiserver IP:PORT
kubectl config set-cluster kubernetes \
--certificate-authority=/opt/kubernetes/ssl/ca.pem \
--embed-certs=true \
--server=${KUBE_APISERVER} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-scheduler \
--client-certificate=./kube-scheduler.pem \
--client-key=./kube-scheduler-key.pem \
--embed-certs=true \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \
--cluster=kubernetes \
--user=kube-scheduler \
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
(3)systemd 管理 scheduler
cat > /usr/lib/systemd/system/kube-scheduler.service << EOF
[Unit]
Description=Kubernetes Scheduler
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-scheduler.conf
ExecStart=/opt/kubernetes/bin/kube-scheduler \$KUBE_SCHEDULER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
(4)启动并设置开机启动
#kube-scheduler启动并设置开机启动
systemctl daemon-reload
systemctl start kube-scheduler
systemctl enable kube-scheduler
systemctl status kube-scheduler
(10)查看集群状态
所有组件都已经启动成功, 通过 kubectl 工具查看当前集群组件状态:
如下输出说明 Master 节点组件运行正常。
[root@k8smaster k8s]# kubectl get cs
Warning: v1 ComponentStatus is deprecated in v1.19+
NAME STATUS MESSAGE ERROR
scheduler Healthy ok
controller-manager Healthy ok
etcd-0 Healthy {"health":"true"}
etcd-1 Healthy {"health":"true"}
etcd-2 Healthy {"health":"true"}
到此k8s master节点部署完成了。
5.6 报错:
如果我们在执行kubectl 命令报错:
The connection to the server localhost:8080 was refused - did you specify the right host or port?
解析:通过kubectl 来访问apiserver时,也是通过https的。我们在第三节为etcd和apiserver自签证书
的时候结束过,上图中红色线部分都是通过https的方式,需要有k8s CA机构生成的证书,各个节点(scheduler,controller-manager)需要携带有它生成的客户端证书(kubeconfig)访问apiserver。kubectl 访问apiserver也是同样的原理,需要也要带着客户端证书(kubeconfig),为此我们需要为kubectl 单独分配一下kubeconfig。
为kubectl 分配kubeconfig的方式也是类似的。
(2) 生成admin.kubeconfig
注意cn字段是admin,并且将其绑定到system:master 组下面。这样就具备了链接k8s 集群管理员权限。
# 切换目录
cd ~/TLS/k8s/
# 创建证书请求文件
cat > admin-csr.json<< EOF
{
"CN":"admin",
"hosts":[],
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"Beijing",
"ST":"Beijing",
"O":"system:masters",
"OU":"System"
}
]
}
EOF
# 生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes admin-csr.json | cfssljson -bare admin
生成kubeconfig 文件
# 创建目录:因为kubectl的默认配置文件为/user/.kube/路径下的config文件。
mkdir /root/.kube
#切换到刚才生成kube-scheduler 证书地方
cd ~/TLS/k8s/
# 设置环境变量KUBE_CONFIG
KUBE_CONFIG="/root/.kube/config"
#配置环境变量KUBE_APISERVER
KUBE_APISERVER="https://192.168.25.217:6443" # apiserver IP:PORT
kubectl config set-cluster kubernetes \
--certificate-authority=/opt/kubernetes/ssl/ca.pem \
--embed-certs=true \
--server=${KUBE_APISERVER} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials cluster-admin \
--client-certificate=./admin.pem \
--client-key=./admin-key.pem \
--embed-certs=true \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \
--cluster=kubernetes \
--user=cluster-admin \
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
6、work node节点部署,包括kubelet,kube-proxy,docker(已部署),etcd(已部署)
6.1 部署kubelet
6.1.1 在所有work node节点上创建k8s文件夹
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}
6.1.2 给所有work node 节点复制kubectl和kube-proxy
在master节点上,将kubernetes-server-linux-amd64.tar.gz解压包中的kubectl,和kube-proxy复制到每个node节点。
#复制 kube-proxy
scp kube-proxy root@192.168.25.218:/opt/kubernetes/bin/
scp kube-proxy root@192.168.25.219:/opt/kubernetes/bin/
# 复制kubelet
scp kubelet root@192.168.25.218:/opt/kubernetes/bin/
scp kubelet root@192.168.25.219:/opt/kubernetes/bin/
# 复制kubectl
#scp kubectl root@192.168.25.218:/usr/bin/
#scp kubectl root@192.168.25.219:/usr/bin/
6.1.3 所有work node节点创建kubelet.conf 文件
其中–hostname-override 改成对用node节点的主机名称,我们这里是k8snode1和k8snode2
cat > /opt/kubernetes/cfg/kubelet.conf << EOF
KUBELET_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/opt/kubernetes/logs \\
--hostname-override=k8snode1 \\
--network-plugin=cni \\
--kubeconfig=/opt/kubernetes/cfg/kubelet.kubeconfig \\
--bootstrap-kubeconfig=/opt/kubernetes/cfg/bootstrap.kubeconfig \\
--config=/opt/kubernetes/cfg/kubelet-config.yml \\
--cert-dir=/opt/kubernetes/ssl \\
--pod-infra-container-image=lizhenliang/pause-amd64:3.0"
EOF
– hostname-override: 显示名称, 集群中唯一
– network-plugin: 启用 CNI
– kubeconfig: 空路径, 会自动生成, 后面用于连接 apiserver
– bootstrap-kubeconfig: 首次启动向 apiserver 申请证书
– config: 配置参数文件
– cert-dir: kubelet 证书生成目录
– pod-infra-container-image: 管理 Pod 网络容器的镜像
6.1.4 所有work node节点创建 kubectl 参数配置文件
cat > /opt/kubernetes/cfg/kubelet-config.yml << EOF
kind: KubeletConfiguration
apiVersion: kubelet.config.k8s.io/v1beta1
address: 0.0.0.0
port: 10250
readOnlyPort: 10255
cgroupDriver: cgroupfs
clusterDNS:
- 10.0.0.2
clusterDomain: cluster.local
failSwapOn: false
authentication:
anonymous:
enabled: false
webhook:
cacheTTL: 2m0s
enabled: true
x509:
clientCAFile: /opt/kubernetes/ssl/ca.pem
authorization:
mode: Webhook
webhook:
cacheAuthorizedTTL: 5m0s
cacheUnauthorizedTTL: 30s
evictionHard:
imagefs.available: 15%
memory.available: 100Mi
nodefs.available: 10%
nodefs.inodesFree: 5%
maxOpenFiles: 1000000
maxPods: 110
EOF
6.1.5 所有work node节点生成bootstrap.kubeconfig 文件
将master节点/opt/kubernetes/ssl/所有文件复制到每个work node节点
cd /opt/kubernetes/ssl
scp ca* server* root@192.168.25.218:/opt/kubernetes/ssl/
scp ca* server* root@192.168.25.219:/opt/kubernetes/ssl/
在master 节点生成 kubelet bootstrap kubeconfig 配置文件 ,并复制到各个work node 节点。
#配置环境变量KUBE_APISERVER
KUBE_APISERVER="https://192.168.25.217:6443" # apiserver IP:PORT
# 配置环境变量token
TOKEN="fb69c54a1cbcd419b668cf8418c3b8cd" # 与 token.csv 里保持一致
# 设置环境变量KUBE_CONFIG
KUBE_CONFIG="/opt/kubernetes/cfg/bootstrap.kubeconfig"
kubectl config set-cluster kubernetes \
--certificate-authority=/opt/kubernetes/ssl/ca.pem \
--embed-certs=true \
--server=${KUBE_APISERVER} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials "kubelet-bootstrap" \
--token=${TOKEN} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \
--cluster=kubernetes \
--user="kubelet-bootstrap" \
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
#切换目录:
cd /opt/kubernetes/cfg
#复制bootstrap.kubeconfig
scp bootstrap.kubeconfig root@192.168.25.218:/opt/kubernetes/cfg/
scp bootstrap.kubeconfig root@192.168.25.219:/opt/kubernetes/cfg/
6.1.6 所有work node 节点通过systemd管理kubelet,启动并设置开机自启动
cat > /usr/lib/systemd/system/kubelet.service << EOF
[Unit]
Description=Kubernetes Kubelet
After=docker.service
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kubelet.conf
ExecStart=/opt/kubernetes/bin/kubelet \$KUBELET_OPTS
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
systemctl daemon-reload
systemctl start kubelet
systemctl enable kubelet
systemctl status kubelet
6.1.7 在master节点上批准 kubelet 证书申请并加入集群(在master节点上执行)
#查看 kubelet 证书请求
kubectl get csr
# 批准申请
kubectl certificate approve node-csr-uCEGPOIiDdlLODKts8J658HrFq9CZ--K6M4G7bjhk8A
# 查看节点,需要等10S左右,因为需要配置。
kubectl get node
由于网络插件还没有部署, 节点会没有准备就绪 NotReady
6.1.8 所有work node 节点部署 kube-proxy
- 创建配置文件
cat > /opt/kubernetes/cfg/kube-proxy.conf << EOF
KUBE_PROXY_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/opt/kubernetes/logs \\
--config=/opt/kubernetes/cfg/kube-proxy-config.yml"
EOF
- 配置参数文件
注意:kubeconfig前面有两个空格。
hostnameOverride 为当前主机名称,node1 节点为k8snode1,node2 为k8snode2
cat > /opt/kubernetes/cfg/kube-proxy-config.yml << EOF
kind: KubeProxyConfiguration
apiVersion: kubeproxy.config.k8s.io/v1alpha1
bindAddress: 0.0.0.0
metricsBindAddress: 0.0.0.0:10249
clientConnection:
kubeconfig: /opt/kubernetes/cfg/kube-proxy.kubeconfig
hostnameOverride: k8snode1
clusterCIDR: 10.0.0.0/24
EOF
- 生成 kube-proxy.kubeconfig 文件
在master 节点上生成 kube-proxy 证书:
# 切换目录
cd ~/TLS/k8s
# 创建证书请求文件
cat > kube-proxy-csr.json<< EOF
{
"CN":"system:kube-proxy",
"hosts":[
],
"key":{
"algo":"rsa",
"size":2048
},
"names":[
{
"C":"CN",
"L":"BeiJing",
"ST":"BeiJing",
"O":"k8s",
"OU":"System"
}
]
}
EOF
# 生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-proxy-csr.json | cfssljson -bare kube-proxy
ls kube-proxy*pem
kube-proxy-key.pem kube-proxy.pem
生成 kubeconfig 文件:
KUBE_APISERVER="https://192.168.25.217:6443"
KUBE_CONFIG="/opt/kubernetes/cfg/kube-proxy.kubeconfig"
kubectl config set-cluster kubernetes \
--certificate-authority=/opt/kubernetes/ssl/ca.pem \
--embed-certs=true \
--server=${KUBE_APISERVER} \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-proxy \
--client-certificate=./kube-proxy.pem \
--client-key=./kube-proxy-key.pem \
--embed-certs=true \
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \
--cluster=kubernetes \
--user=kube-proxy \
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
在master节点上将kube-proxy.kubeconfig拷贝到所有work node节点指定路径:
scp /opt/kubernetes/cfg/kube-proxy.kubeconfig root@192.168.25.218:/opt/kubernetes/cfg/
scp /opt/kubernetes/cfg/kube-proxy.kubeconfig root@192.168.25.219:/opt/kubernetes/cfg/
在所有work node 节点上通过systemd管理kube-proxy
cat > /usr/lib/systemd/system/kube-proxy.service << EOF
[Unit]
Description=Kubernetes Proxy
After=network.target
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-proxy.conf
ExecStart=/opt/kubernetes/bin/kube-proxy \$KUBE_PROXY_OPTS
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
启动并设置开机启动
systemctl daemon-reload
systemctl start kube-proxy
systemctl status kube-proxy
systemctl enable kube-proxy
7、部署集群网络
7.1 、部署calico
文件下载:https://download.csdn.net/download/aiming66/43113519
kubectl apply -f calico.yaml
kubectl get pods -n kube-system
kubectl get node
kubectl apply -f calico.yaml
命令需要下载镜像,有点慢,需要等待几分钟。
部署好网络插件。显示未runing状态
此时查看node状态为ready
报错:
如果此时,安装完成cni,calico也是已经处于runing状态了,但是kubectl get nodes 的还是notready状态。可以通过如下命令,然后看最后的Events 事件。
kubectl describe node XXX # XXX 标识node名称。
7.2、实验(在master节点上执行命令)
我们在k8s 集群中创建一个nginx服务。
创建一个pod
kubectl create deployment nginx --image=nginx
等待pod创建成功,即为ready状态。
[root@localhost ~]# kubectl get pods
NAME READY STATUS RESTARTS AGE
nginx-f89759699-xk2lm 1/1 Running 0 10m
此时暴露服务端口:
kubectl expose deployment nginx --port=80 --type=NodePort
查询对外 暴露的端口:
[root@localhost ~]#
NAME READY STATUS RESTARTS AGE
pod/nginx-f89759699-kcscl 1/1 Running 0 110s
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
service/kubernetes ClusterIP 10.96.0.1 <none> 443/TCP 45m
service/nginx NodePort 10.99.195.202 <none> 80:31408/TCP 53s
我们可以看到,nginx暴露的服务端口为31408,
接下来我们通过http://NodeIP:Port的方式来访问,nodeip为任意node节点的ip。port为31408。
8、新增加Worker Node
- 拷贝已部署好的Node相关文件到新节点
在work node节点将Worker Node涉及文件拷贝到新节点
scp -r /opt/kubernetes root@192.168.25.220:/opt/
scp -r /usr/lib/systemd/system/{kubelet,kube-proxy}.service root@192.168.25.220:/usr/lib/systemd/system
scp /opt/kubernetes/ssl/ca.pem root@192.168.25.220:/opt/kubernetes/ssl
- 删除kubelet证书和kubeconfig文件
rm -f /opt/kubernetes/cfg/kubelet.kubeconfig
rm -f /opt/kubernetes/ssl/kubelet*
注:这几个文件是证书申请审批后自动生成的,每个Node不同,必须删除
3. 修改主机名
vi /opt/kubernetes/cfg/kubelet.conf
--hostname-override=k8snode3
vi /opt/kubernetes/cfg/kube-proxy-config.yml
hostnameOverride: k8snode3
- 启动并设置开机启动
systemctl daemon-reload
systemctl start kubelet kube-proxy
systemctl enable kubelet kube-proxy
5、master 节点上查看证书请求
kubectl get csr
NAME AGE SIGNERNAME REQUESTOR CONDITION
node-csr-4zTjsaVSrhuyhIGqsefxzVoZDCNKei-aE2jyTP81Uro 89s kubernetes.io/kube-apiserver-client-kubelet kubelet-bootstrap Pending
6、批准新Node kubelet证书申请
kubectl certificate approve node-csr-4zTjsaVSrhuyhIGqsefxzVoZDCNKei-aE2jyTP81Uro
- 查看Node状态
kubectl get node
9、 授权 apiserver 访问 kubelet
这一步主要是为后续使用kubectl做准备。
应用场景:例如kubectl logs
cat > apiserver-to-kubelet-rbac.yaml << EOF
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
annotations:
rbac.authorization.kubernetes.io/autoupdate: "true"
labels:
kubernetes.io/bootstrapping: rbac-defaults
name: system:kube-apiserver-to-kubelet
rules:
- apiGroups:
- ""
resources:
- nodes/proxy
- nodes/stats
- nodes/log
- nodes/spec
- nodes/metrics
- pods/log
verbs:
- "*"
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: system:kube-apiserver
namespace: ""
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: system:kube-apiserver-to-kubelet
subjects:
- apiGroup: rbac.authorization.k8s.io
kind: User
name: kubernetes
EOF
kubectl apply -f apiserver-to-kubelet-rbac.yaml
到此,搭建单master 集群完成!