目录
一、数据存储介绍
在前面已经提到,容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,kubernetes引入了Volume的概念。
Volume是Pod中能够被多个容器访问的共享目录,它被定义在Pod上,然后被一个Pod里的多个容器挂载到具体的文件目录下,kubernetes通过Volume实现同一个Pod中不同容器之间的数据共享以及数据的持久化存储。Volume的生命容器不与Pod中单个容器的生命周期相关,当容器终止或者重启时,Volume中的数据也不会丢失。
kubernetes的Volume支持多种类型,比较常见的有下面几个:
-
简单存储:EmptyDir、HostPath、NFS
-
高级存储:PV、PVC
-
配置存储:ConfigMap、Secret
二、基本存储
1、基本存储之EmptyDir
(缺点:EmptyDir数据不会被持久化,会随着pod的结束而销毁)
(1)、介绍
EmptyDir是最基础的Volume类型,一个EmptyDir就是Host上的一个空目录。
EmptyDir是在Pod被分配到Node时创建的,它的初始内容为空,并且无须指定宿主机上对应的目录文件,因为kubernetes会自动分配一个目录,当Pod销毁时, EmptyDir中的数据也会被永久删除。 EmptyDir用途如下:
-
临时空间,例如用于某些应用程序运行时所需的临时目录,且无须永久保留
-
一个容器需要从另一个容器中(同一个Pod内的容器)获取数据的目录(多容器共享目录)
(2)、实例演示
接下来,通过一个容器之间文件共享的案例来使用一下EmptyDir。
在一个Pod中准备两个容器nginx和busybox,然后声明一个Volume分别挂在到两个容器的目录中,然后nginx容器负责向Volume中写日志,busybox中通过命令将日志内容读到控制台。
创建volume-emptydir.yaml,内容如下:
apiVersion: v1
kind: Pod
metadata:
name: volume-emptydir
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts: # 将logs-volume挂在到nginx容器中,对应的目录为 /var/log/nginx
- name: logs-volume #引用下面声明的volume,名称保持一致
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"] # 初始命令,动态读取指定文件中内容,将日志读到busybox容器控制台,这样就可以通过kubectl logs直接查看日志
volumeMounts: # 将logs-volume 挂在到busybox容器中,对应的目录为 /logs
- name: logs-volume #引用下面声明的volume,名称保持一致
mountPath: /logs #这样/logs和/var/log/nginx就成为一个共享目录了
volumes: # 声明volume, name为logs-volume,类型为emptyDir
- name: logs-volume
emptyDir: {}
创建pod:
kubectl create -f volume-emptydir.yaml
查看pod:
kubectl get pods volume-emptydir -n dev -o wide
通过pod IP访问nginx:
curl 10.244.2.61
通过kubectl logs命令查看指定容器的标准输出:
kubectl logs -f volume-emptydir -n dev -c busybox
如上图可以看到,在nginx容器的日志可以共享到busybox容器查看,实现了同一个pod内的多个容器之间的存储共享
2、基本存储之-HostPath
(特点:HostPath存储是存放在node主机的一个实际目录中,因此不会随着pod的结束而销毁)
(1)、介绍
上文提到,EmptyDir中数据不会被持久化,它会随着Pod的结束而销毁,如果想简单的将数据持久化到主机中,可以选择HostPath。
HostPath就是将Node主机中一个实际目录挂在到Pod中,以供容器使用,这样的设计就可以保证Pod销毁了,但是数据依据可以存在于Node主机上。
(2)、实例演示
创建一个volume-hostpath.yaml:
apiVersion: v1
kind: Pod
metadata:
name: volume-hostpath
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts:
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"]
volumeMounts:
- name: logs-volume
mountPath: /logs
volumes:
- name: logs-volume
hostPath:
path: /root/logs
type: DirectoryOrCreate # 目录(即上面path定义的目录)存在就使用,不存在就先创建后使用
关于上述配置中type参数的值的说明:
关于type的值的一点说明:
DirectoryOrCreate 目录存在就使用,不存在就先创建后使用
Directory 目录必须存在
FileOrCreate 文件存在就使用,不存在就先创建后使用
File 文件必须存在
Socket unix套接字必须存在
CharDevice 字符设备必须存在
BlockDevice 块设备必须存在
创建pod:
kubectl create -f volume-hostpath.yaml
查看pod:
kubectl get pods volume-hostpath -n dev -o wide
访问nginx:
curl 10.244.1.56
通过kubectl logs命令查看指定容器的标准输出:
kubectl logs -f volume-hostpath -n dev -c busybox
接下来就可以去host的/root/logs目录下查看存储的文件了
注意: 下面的操作需要到Pod所在的节点运行(案例中是node1)
同样的道理,如果在此目录下创建一个文件,到容器中也是可以看到的
删除pod,查看node节点日志文件依然存在:
kubectl delete -f volume-hostpath.yaml
3、基本存储之-NFS
(特点:不仅解决了数据持久化的问题,也可以防止node节点故障或pod转移存储无法访问问题)
(1)、介绍
HostPath可以解决数据持久化的问题,但是一旦Node节点故障了,Pod如果转移到了别的节点,又会出现问题了,此时需要准备单独的网络存储系统,比较常用的用NFS、CIFS。
NFS是一个网络文件存储系统,可以搭建一台NFS服务器,然后将Pod中的存储直接连接到NFS系统上,这样的话,无论Pod在节点上怎么转移,只要Node跟NFS的对接没问题,数据就可以成功访问。注意在实际生产环境中会有单独的设备做nfs服务器,并对nfs做高可用,防止nfs也宕机。当然除了使用nfs之外,还可以使用CIFS、GlusterFS等。
(2)、实例演示
首先要准备nfs的服务器,这里为了简单,直接是master节点做nfs服务器
在master节点安装nfs服务:
yum install nfs-utils -y
准备一个共享目录:
mkdir /root/data/nfs -pv
将共享目录以读写权限暴露给192.168.1.0/24网段中的所有主机:
vim /etc/exports
添加如下内容:
/root/data/nfs 192.168.1.0/24(rw,no_root_squash)
启动nfs服务:
systemctl restart nfs
systemctl enable nfs
接下来,要在的每个node节点上都安装下nfs,这样的目的是为了node节点可以驱动nfs设备:
在node上安装nfs服务,注意不需要启动:
yum install nfs-utils -y
接下来编写Pod的配置文件,创建volume-nfs.yaml:
apiVersion: v1
kind: Pod
metadata:
name: volume-nfs
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
ports:
- containerPort: 80
volumeMounts:
- name: logs-volume
mountPath: /var/log/nginx
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","tail -f /logs/access.log"]
volumeMounts:
- name: logs-volume
mountPath: /logs
volumes:
- name: logs-volume
nfs:
server: 192.168.1.50 #nfs服务器地址
path: /root/data/nfs #共享文件路径
创建pod:
kubectl create -f volume-nfs.yaml
查看pod:
kubectl get pods volume-nfs -n dev -o wide
查看nfs服务器上的共享目录,发现已经有文件了
ls /root/data/nfs/
三、高级存储
1、pv和pvc介绍
前面已经介绍了使用NFS提供存储,此时就要求用户会搭建NFS系统,并且会在yaml配置nfs。由于kubernetes支持的存储系统有很多,要求客户全都掌握,显然不现实。为了能够屏蔽底层存储实现的细节,方便用户使用, kubernetes引入PV和PVC两种资源对象。
-
PV(Persistent Volume)是持久化卷的意思,是对底层的共享存储的一种抽象。一般情况下PV由kubernetes管理员进行创建和配置,它与底层具体的共享存储技术有关,并通过插件完成与共享存储的对接。
-
PVC(Persistent Volume Claim)是持久卷声明的意思,是用户对于存储需求的一种声明。换句话说,PVC其实就是用户向kubernetes系统发出的一种资源需求申请。
如上图所示,用户只需要根据pod需要使用多少存储的需求,通过pvc将存储需求发送给管理员,管理员的pv会根据申请需求来分配存储,这样用户就不需要知道太多的存储细节和源里,存储机制和原理只需要管理员来了解就行了。
使用了PV和PVC之后,工作可以得到进一步的细分:
-
存储:存储工程师维护
-
PV: kubernetes管理员维护
-
PVC:kubernetes用户维护
2、高级存储之pv
(1)、介绍
PV是存储资源的抽象,下面是资源清单文件:
apiVersion: v1
kind: PersistentVolume
metadata: #注意这里是没有namespace配置的,因为pv是集群级别的资源,是跨namespace使用的,不具体在某个namespace之下
name: pv2
spec:
nfs: # 存储类型,与底层真正存储对应
capacity: # 存储能力,目前只支持存储空间的设置
storage: 2Gi
accessModes: # 访问模式
storageClassName: # 存储类别
persistentVolumeReclaimPolicy: # 回收策略
PV 的关键配置参数说明:
-
存储类型
底层实际存储的类型,kubernetes支持多种存储类型,每种存储类型的配置都有所差异
-
存储能力(capacity)
目前只支持存储空间的设置( storage=1Gi ),不过未来可能会加入IOPS、吞吐量等指标的配置
-
访问模式(accessModes)
用于描述用户应用对存储资源的访问权限,访问权限包括下面几种方式:
需要注意的是,底层不同的存储类型可能支持的访问模式不同
-
ReadWriteOnce(RWO):读写权限,但是只能被单个节点挂载
-
ReadOnlyMany(ROX): 只读权限,可以被多个节点挂载
-
ReadWriteMany(RWX):读写权限,可以被多个节点挂载
-
回收策略(persistentVolumeReclaimPolicy)
当PV不再被使用了之后,对其的处理方式。目前支持三种策略:
需要注意的是,底层不同的存储类型可能支持的回收策略不同
-
Retain (保留) 保留数据,需要管理员手工清理数据
-
Recycle(回收) 清除 PV 中的数据,效果相当于执行 rm -rf /thevolume/*
-
Delete (删除) 与 PV 相连的后端存储完成 volume 的删除操作,当然这常见于云服务商的存储服务
-
-
-
存储类别
PV可以通过storageClassName参数指定一个存储类别
-
具有特定类别的PV只能与请求了该类别的PVC进行绑定
-
未设定类别的PV则只能与不请求任何类别的PVC进行绑定
-
-
状态(status)
一个 PV 的生命周期中,可能会处于4中不同的阶段:
-
Available(可用): 表示可用状态,还未被任何 PVC 绑定
-
Bound(已绑定): 表示 PV 已经被 PVC 绑定
-
Released(已释放): 表示 PVC 被删除,但是资源还未被集群重新声明
-
Failed(失败): 表示该 PV 的自动回收失败
-
(2)、实例演示
使用NFS作为存储,来演示PV的使用,创建3个PV,对应NFS中的3个暴露的路径。
步骤1:准备NFS环境
#创建目录
mkdir /root/data/{pv1,pv2,pv3} -pv
#暴露服务
cat << EOF > /etc/exports
/root/data/pv1 192.168.1.0/24(rw,no_root_squash)
/root/data/pv2 192.168.1.0/24(rw,no_root_squash)
/root/data/pv3 192.168.1.0/24(rw,no_root_squash)
EOF
重启服务
systemctl restart nfs
步骤2:创建pv.yaml
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv1
spec:
capacity:
storage: 1Gi #1GB大小
accessModes:
- ReadWriteMany #可读可写,可以多节点挂载
persistentVolumeReclaimPolicy: Retain #回收策略:保留
nfs:
path: /root/data/pv1
server: 192.168.1.50
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv2
spec:
capacity:
storage: 2Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
nfs:
path: /root/data/pv2
server: 192.168.1.50
---
apiVersion: v1
kind: PersistentVolume
metadata:
name: pv3
spec:
capacity:
storage: 3Gi
accessModes:
- ReadWriteMany
persistentVolumeReclaimPolicy: Retain
nfs:
path: /root/data/pv3
server: 192.168.1.50
以上yaml会创建3个pv。
#创建pv
kubectl create -f pv.yaml
#查看pv,注意这里就不要加命名空间了
kubectl get pv -o wide
其中CLAIM是显示被那个pvc绑定,目前还未绑定,所以空着,STORAGECLASS指存储类型,至此pv创建实例已完成。
3、高级存储之pvc
(1)、介绍
PVC是资源的申请,用来声明对存储空间、访问模式、存储类别需求信息。下面是资源清单文件:
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc
namespace: dev
spec:
accessModes: # 访问模式
selector: # 采用标签对PV选择
storageClassName: # 存储类别
resources: # 请求空间
requests:
storage: 5Gi
PVC 的关键配置参数说明:
-
访问模式(accessModes)
用于描述用户应用对存储资源的访问权限
-
选择条件(selector)
通过Label Selector的设置,可使PVC对于系统中己存在的PV进行筛选
-
存储类别(storageClassName)
PVC在定义时可以设定需要的后端存储的类别,只有设置了该class的pv才能被系统选出
-
资源请求(Resources )
描述对存储资源的请求
(2)、实例演示
步骤1:创建pvc.yaml,申请pv
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc1
namespace: dev #pvc是属于namespace的
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc2
namespace: dev
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: pvc3
namespace: dev
spec:
accessModes:
- ReadWriteMany
resources:
requests:
storage: 1Gi #如果这边pvc大小大于pv,那么分配会有问题,绑定状态会变成Pending
# 创建pvc
kubectl create -f pvc.yaml
# 查看pvc
kubectl get pvc -n dev -o wide
如上图:STATUS的Bound为已绑定状态,如果是Pending则是绑定未成功。
再查看pv:
kubectl get pv
如上可以看到,pv已和pvc绑定,状态均为Bound绑定状态。
步骤2:创建pods.yaml, 使用pv
apiVersion: v1
kind: Pod
metadata:
name: pod1
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true;do echo pod1 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/ #将下面指定的pvc1挂载到pod的容器里的/root/下
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc1
readOnly: false #false是可读写,true是只读
---
apiVersion: v1
kind: Pod
metadata:
name: pod2
namespace: dev
spec:
containers:
- name: busybox
image: busybox:1.30
command: ["/bin/sh","-c","while true;do echo pod2 >> /root/out.txt; sleep 10; done;"]
volumeMounts:
- name: volume
mountPath: /root/
volumes:
- name: volume
persistentVolumeClaim:
claimName: pvc2
readOnly: false
创建pod:
kubectl create -f pods.yaml
查看pod:
kubectl get pods -n dev -o wide
查看pvc:
kubectl get pvc -n dev -o wide
查看pv:
kubectl get pv -n dev -o wide
查看nfs中的文件存储:
tail -5f /root/data/pv1/out.txt
tail -5f /root/data/pv2/out.txt
4、高级存储之pv和pvc的生命周期
PVC和PV是一一对应的,PV和PVC之间的相互作用遵循以下生命周期:
-
资源供应:管理员手动创建底层存储和PV
-
资源绑定:用户创建PVC,kubernetes负责根据PVC的声明去寻找PV,并绑定
在用户定义好PVC之后,系统将根据PVC对存储资源的请求在已存在的PV中选择一个满足条件的
-
一旦找到,就将该PV与用户定义的PVC进行绑定,用户的应用就可以使用这个PVC了
-
如果找不到,PVC则会无限期处于Pending状态,直到等到系统管理员创建了一个符合其要求的PV
PV一旦绑定到某个PVC上,就会被这个PVC独占,不能再与其他PVC进行绑定了
-
-
资源使用:用户可在pod中像volume一样使用pvc
Pod使用Volume的定义,将PVC挂载到容器内的某个路径进行使用。
-
资源释放:用户删除pvc来释放pv
当存储资源使用完毕后,用户可以删除PVC,与该PVC绑定的PV将会被标记为“已释放”,但还不能立刻与其他PVC进行绑定。通过之前PVC写入的数据可能还被留在存储设备上,只有在清除之后该PV才能再次使用。
-
资源回收:kubernetes根据pv设置的回收策略进行资源的回收
对于PV,管理员可以设定回收策略,用于设置与之绑定的PVC释放资源之后如何处理遗留数据的问题。只有PV的存储空间完成回收,才能供新的PVC绑定和使用
四、配置存储
1、配置存储之configmap
ConfigMap是一种比较特殊的存储卷,它的主要作用是用来存储配置信息的。
创建configmap.yaml,内容如下:
apiVersion: v1
kind: ConfigMap
metadata:
name: configmap
namespace: dev
data:
info: | # info是key,下面是value,key--->文件 value---->文件中的内容
username:admin
password:123456
接下来,使用此配置文件创建configmap:
# 创建configmap
kubectl create -f configmap.yaml
# 查看configmap详情
kubectl describe cm configmap -n dev
接下来创建一个pod-configmap.yaml,将上面创建的configmap挂载进去:
apiVersion: v1
kind: Pod
metadata:
name: pod-configmap
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts: # 将configmap挂载到目录
- name: config
mountPath: /configmap/config
volumes: # 引用configmap
- name: config
configMap:
name: configmap # 这边使用的configmap名必须和上面创建的configmap名对应
# 创建pod
kubectl create -f pod-configmap.yaml
# 查看pod
kubectl get pod pod-configmap -n dev
#进入容器
kubectl exec -it pod-configmap -n dev /bin/sh
可以看到映射已经成功,每个configmap都映射成了一个目录
key--->文件 value---->文件中的内容
此时如果更新configmap的内容, 容器中的值也会动态更新
我们下面修改configmap,查看是否动态更新:
# 编辑configmap,将password内容改成123456789
kubectl edit configmap -n dev
# 再次进入容器查看是否变化,另动态更新是需要时间的
kubectl exec -it pod-configmap -n dev /bin/sh
2、配置存储之-secret
在kubernetes中,还存在一种和ConfigMap非常类似的对象,称为Secret对象。它主要用于存储敏感信息,例如密码、秘钥、证书等等。
(1)、首先使用base64对数据进行编码
echo -n 'admin' | base64
echo -n '123456' | base64
(2)、接下来编写secret.yaml,并创建Secret
apiVersion: v1
kind: Secret
metadata:
name: secret
namespace: dev
type: Opaque
data:
username: YWRtaW4=
password: MTIzNDU2
# 创建secret
kubectl create -f secret.yaml
# 查看secret详情
kubectl describe secret secret -n dev
(3)、创建pod-secret.yaml,将上面创建的secret挂载进去
apiVersion: v1
kind: Pod
metadata:
name: pod-secret
namespace: dev
spec:
containers:
- name: nginx
image: nginx:1.17.1
volumeMounts: # 将secret挂载到目录
- name: config
mountPath: /secret/config
volumes:
- name: config
secret:
secretName: secret
# 创建pod
kubectl create -f pod-secret.yaml
# 查看pod
kubectl get pod pod-secret -n dev
# 进入容器,查看secret信息,发现已经自动解码了
kubectl exec -it pod-secret /bin/sh -n dev
至此,已经实现了利用secret实现了信息的编码。